システムは,個々のプロセスやサービスによって提供されています。このため,プロセスやサービスの稼働状況を把握することは,システムの安定運用に欠かせません。
システムの機能を提供するプロセスやサービスが異常終了した場合,運用システムが停止し重大な影響が発生します。このため,プロセスの生成,消滅,および起動状況やサービスの起動状況を監視し,早急に異常を検知し対策を立てることが必要です。
PFM - Agent for Platformでは,情報収集のタイミングでプロセスを監視しています。このため,プロセスの存在確認をしている場合でも,プロセスが消滅したタイミングではなく,PFM - Agent for Platform が情報を収集したタイミングでプロセスの消滅が検知されることに注意してください。
プロセスおよびサービスを監視するためのレコードとフィールドを次の表に示します。
表3-7 プロセスおよびサービスに関連する主なフィールド
使用レコード | 使用フィールド | 値の見方(例) |
---|---|---|
PI_WGRP | Process Count | プロセス数。しきい値(起動している必要があるプロセス数)以下の場合,プロセスが停止していることを示す。※ |
PD_PDI | Program | プロセス名。レコード収集されない場合,プロセスが停止していることを示す。 |
PD_ASVC, PD_SVC | Service Name | サービス名および起動状態。アプリケーションサービス(プロセス)が起動中(RUNNING)以外の場合,サービスが停止していることを示す。 |
Display Name | ||
State | ||
PD_APS | Program Name | プロセス名。レコード収集されない場合,プロセスが停止していることを示す。 |
PD_APP, PD_APP2 | Application Name | アプリケーション定義名。 |
Application Exist | アプリケーションの状態。NORMALの場合,各監視対象のうちどれかの状態がNORMALの状態であることを示す。ABNORMALの場合,各監視対象の状態がすべてABNORMALの状態であることを示す。 | |
Application Status | アプリケーションの状態。NORMALの場合,各監視対象の状態がすべてNORMALの状態であることを示す。ABNORMALの場合,各監視対象のうちどれかの状態がABNORMALであることを示す。 | |
PD_APPD | Application Name | 監視数の条件結果。Monitoring Statusフィールドの値がABNORMALの場合,プログラム,サービス,またはコマンドラインのうち,どれかの起動数が指定範囲外であることを示す。 |
Monitoring Label | ||
Monitoring Status |
・プロセスの消滅を監視したい
プロセスの消滅は,監視テンプレートで提供しているProcess Endアラームを使用することで,監視できます。
プロセスが異常終了した場合,運用システムが停止し重大な影響が発生します。早急に復旧させるために,プロセスの消滅をアラームで監視できます。
詳細については,「3.2.5(1) 監視テンプレート」を参照してください。
・プロセスの生成を監視したい
プロセスの生成は,監視テンプレートで提供しているProcess Aliveアラームを使用することで,監視できます。
プロセスの生成は,アプリケーション単位での監視やスケジュールされたプロセスの状況など,運用システムが正しく動作しているかどうかをアラームで監視できます。
収集データ追加ユーティリティのワークグループの設定とPI_WGRPレコードを使用することで,プロセスの生成や消滅,同一名称のプロセス数,アプリケーション単位のプロセス数,およびユーザーごとのプロセス起動数などさまざまな監視を行えます。
詳細については,「3.2.5(1) 監視テンプレート」を参照してください。
・サービスの停止を監視したい
サービスの停止は,監視テンプレートで提供しているService(Service Nm)アラームまたはService(Display Nm)アラームを使用することで,監視できます。
サービスが異常終了した場合,運用システムが停止し重大な影響が発生します。
早急に復旧させるために,サービスの起動状況をアラームで監視できます。
詳細については,「3.2.5(1) 監視テンプレート」を参照してください。