3.1.5 プロセス・サービスの監視例

プロセスおよびサービスのパフォーマンスを監視する方法について説明します。

<この項の構成>
(1) 概要
(2) 監視方法

(1) 概要

システムは,個々のプロセスやサービスによって提供されています。このため,プロセスやサービスの稼働状況を把握することは,システムの安定運用に欠かせません。

システムの機能を提供するプロセスやサービスが異常終了した場合,運用システムが停止し重大な影響が発生します。このため,プロセスの生成,消滅,および起動状況やサービスの起動状況を監視し,早急に異常を検知し対策を立てることが必要です。

PFM - Agent for Platformでは,情報収集のタイミングでプロセスを監視しています。このため,プロセスの存在確認をしている場合でも,プロセスが消滅したタイミングではなく,PFM - Agent for Platform が情報を収集したタイミングでプロセスの消滅が検知されることに注意してください。

プロセスおよびサービスを監視するためのレコードとフィールドを次の表に示します。

表3-7 プロセスおよびサービスに関連する主なフィールド

使用レコード使用フィールド値の見方(例)
PI_WGRPProcess Countプロセス数。しきい値(起動している必要があるプロセス数)以下の場合,プロセスが停止していることを示す。
PD_PDIProgramプロセス名。レコード収集されない場合,プロセスが停止していることを示す。
PD_ASVC,
PD_SVC
Service Nameサービス名および起動状態。アプリケーションサービス(プロセス)が起動中(RUNNING)以外の場合,サービスが停止していることを示す。
Display Name
State
PD_APSProgram Nameプロセス名。レコード収集されない場合,プロセスが停止していることを示す。
PD_APP,
PD_APP2
Application Nameアプリケーション定義名。
Application Existアプリケーションの状態。NORMALの場合,各監視対象のうちどれかの状態がNORMALの状態であることを示す。ABNORMALの場合,各監視対象の状態がすべてABNORMALの状態であることを示す。
Application Statusアプリケーションの状態。NORMALの場合,各監視対象の状態がすべてNORMALの状態であることを示す。ABNORMALの場合,各監視対象のうちどれかの状態がABNORMALであることを示す。
PD_APPDApplication Name監視数の条件結果。Monitoring Statusフィールドの値がABNORMALの場合,プログラム,サービス,またはコマンドラインのうち,どれかの起動数が指定範囲外であることを示す。
Monitoring Label
Monitoring Status
注※
収集データ追加ユーティリティでの設定が必要です。

(2) 監視方法

・プロセスの消滅を監視したい

プロセスの消滅は,監視テンプレートで提供しているProcess Endアラームを使用することで,監視できます。

プロセスが異常終了した場合,運用システムが停止し重大な影響が発生します。早急に復旧させるために,プロセスの消滅をアラームで監視できます。

詳細については,「3.2.5(1) 監視テンプレート」を参照してください。

・プロセスの生成を監視したい

プロセスの生成は,監視テンプレートで提供しているProcess Aliveアラームを使用することで,監視できます。

プロセスの生成は,アプリケーション単位での監視やスケジュールされたプロセスの状況など,運用システムが正しく動作しているかどうかをアラームで監視できます。

収集データ追加ユーティリティのワークグループの設定とPI_WGRPレコードを使用することで,プロセスの生成や消滅,同一名称のプロセス数,アプリケーション単位のプロセス数,およびユーザーごとのプロセス起動数などさまざまな監視を行えます。

詳細については,「3.2.5(1) 監視テンプレート」を参照してください。

・サービスの停止を監視したい

サービスの停止は,監視テンプレートで提供しているService(Service Nm)アラームまたはService(Display Nm)アラームを使用することで,監視できます。

サービスが異常終了した場合,運用システムが停止し重大な影響が発生します。

早急に復旧させるために,サービスの起動状況をアラームで監視できます。

詳細については,「3.2.5(1) 監視テンプレート」を参照してください。