2.2.5 プロセスおよびサービスの監視例
プロセスおよびサービスの稼働・非稼働を監視することで,運用システムが正しく動作しているかどうかを確認できます。
(1) プロセスおよびサービス監視の概要
システムは,個々のプロセスやサービスによって提供されています。このため,プロセスやサービスの稼働状況を把握することは,システムの安定運用に欠かせません。
システムの機能を提供するプロセスやサービスが異常終了した場合,運用システムが停止し重大な影響が発生します。このため,プロセスやサービスの生成,消滅,および起動状況を監視し,早急に異常を検知し対策を立てることが必要です。
PFM - RM for Platformでは,複数の監視対象ホストから,プロセスの稼働・非稼働情報を収集し,PFM - Web Consoleで監視できます。プロセスの稼働・非稼働情報の収集は,PFM - Web Consoleまたはコマンドで設定します。
なお,PFM - RM for Platformでは,情報収集のタイミングでプロセスを監視しています。このため,プロセスおよびサービスの稼働・非稼働を監視している場合でも,状態が変わったタイミングではなく,PFM - RM for Platformが情報を収集したタイミングで通知されることに注意してください。
また,WMIおよびSSHを使用した収集処理を,別プロセス(コア収集プロセス)とすることで,一定時間内にコア収集プロセスが終了しない場合は,収集が完了していない同一インスタンスの監視対象の性能情報は収集できません。タイムアウトが発生します。
プロセスおよびサービスの稼働・非稼働を監視するためのレコードとフィールドを次の表に示します。
項番 |
使用するレコード |
使用する フィールド |
値の説明 |
値の見方 |
---|---|---|---|---|
1 |
PD_APP2 |
Application Exist |
監視対象に指定されたアプリケーションの状態です。 |
ABNORMALの場合,アプリケーション単位で監視しているプロセスおよびサービスのすべてが停止しているか,必要以上に起動していると考えられます。 |
2 |
Application Status |
監視対象に指定されたアプリケーションの状態です。 |
ABNORMALの場合,アプリケーション単位で監視しているプロセスまたはサービスのうちのどれかが停止しているか,必要以上に起動していると考えられます。 |
|
3 |
PD_APS |
Command Line |
プログラムを実行するコマンドラインです。 |
レコードが収集されない場合,プロセスが停止していると考えられます。 |
4 |
Program Name |
プログラムの名称です。 |
||
5 |
PD_ASVC |
Display Name |
サービスを識別するためにユーザーインターフェースプログラムによって使用される名称です。 |
アプリケーションサービス(プロセス)が起動中(Running)以外の場合,サービスが停止していると考えられます。 |
6 |
Service Name |
サービスコントロールマネージャーデータベースで使用されているサービスの名称です。 |
||
7 |
State |
データ収集時のサービスの状態です。 |
PFM - RM for Platformでプロセスの稼働・非稼働情報を収集する場合,次の方法があります。
-
プロセス単位またはサービス単位で収集する
-
複数のプロセスおよびサービスをグルーピングしてアプリケーション単位で収集する
それぞれの方法で使用するレコードを次の表に示します。
項番 |
レコード |
監視対象 |
格納される情報 |
収集方法 |
---|---|---|---|---|
1 |
PD_APS |
Windows環境またはUNIX環境のプロセス |
監視対象ホストのプロセスについて,ある時点での状態を示すパフォーマンスデータが格納されます。 |
リアルタイム |
2 |
PD_ASVC |
Windows環境のサービス |
監視対象ホストのサービス制御マネージャー(SCM)に登録されている,Win32プロセスなどのアプリケーションサービスについて,ある時点での状態を示すパフォーマンスデータが格納されます。 |
リアルタイム |
項番 |
レコード |
監視対象 |
格納される情報 |
収集方法 |
---|---|---|---|---|
1 |
PD_APP2 |
|
Application Process Overview(PD_APS)レコードおよびApplication Service Overview(PD_ASVC)レコードに格納されるレコードを,アプリケーション単位で,ある時点での状態で要約したパフォーマンスデータが格納されます。 |
|
2 |
PD_APPC |
Application Process Overview(PD_APS)レコードおよびApplication Service Overview(PD_ASVC)レコードに格納されるレコードを,アプリケーション単位で監視しているプロセスおよびサービスごとに,ある時点での状態で要約したパフォーマンスデータが格納されます。 |
||
3 |
PD_APPD |
Application Process Overview(PD_APS)レコードおよびApplication Service Overview(PD_ASVC)レコードに格納されるレコードを,アプリケーション単位で監視しているプロセスおよびサービスごとに,ある時点での状態で要約したパフォーマンスデータが格納されます。Application Process Count(PD_APPC)レコードより詳細なパフォーマンスデータが格納されます。 |
リアルタイム |
プロセスの稼働・非稼働監視の設定で使用する「プロセス名」,「プログラム名」,「プログラムパス」,および「コマンドライン」の関係について,例を使って説明します。
- 監視対象ホストがWindowsの場合の例
- 監視対象ホストがUNIXの場合の例
(2) プロセスおよびサービスの監視に関する監視テンプレートの使用例
プロセスおよびサービスの監視に関する監視テンプレートとして,提供しているアラームとレポートの使用例について説明します。
PFM - RM for Platformでは,Process ExistenceアラームやApplication Statusレポートなどを提供しています。
(a) アラーム
プロセスおよびサービスの稼働・非稼働の監視に関するアラームについて次の表に示します。
項番 |
アラーム |
使用する レコード |
使用する フィールド |
異常 条件 |
警告 条件 |
値の見方 |
---|---|---|---|---|---|---|
1 |
Application Status |
PD_APP2 |
Application Exist |
Application Name = * AND Application Exist = ABNORMAL AND Application Status = ABNORMAL |
Application Name = * AND Application Exist = NORMAL AND Application Status = ABNORMAL |
アプリケーション単位で監視しているプロセスまたはサービスのうちのどれかが停止しているか必要以上に起動している場合,警告または異常状態にあると判断します。 |
2 |
Application Name |
|||||
3 |
Application Status |
|||||
4 |
Process Existence |
PD_APS |
Program Name |
Program Name <> jpcsto.exe※1 |
Program Name <> jpcsto.exe※1 |
レコードが収集されない場合,警告または異常状態にあると判断します。 |
5 |
Service Stop |
PD_ASVC |
Service Name State |
Service Name = JP1PCAGT_7S※2 AND State <> Running |
Service Name = JP1PCAGT_7S※2 AND State <> Running |
監視対象のサービスが起動していない場合,警告または異常状態にあると判断します。 |
6 |
Service Stop(dsp nm) |
PD_ASVC |
Display Name State |
Display Name = PFM - Remote Monitor for Platform※3 AND State <> Running |
Display Name = PFM - Remote Monitor for Platform※3 AND State <> Running |
監視対象のサービスが起動していない場合,警告または異常状態にあると判断します。 |
(b) レポート
プロセスおよびサービスの稼働・非稼働の監視に関するレポートについて次の表に示します。
項番 |
レポート名 |
レポートの表示内容 |
---|---|---|
1 |
Application Process Count |
アプリケーション単位で監視しているプロセスまたはサービスの稼働状況を表示します。 |
2 |
Application Process Status |
|
3 |
Application Status |
アプリケーションの稼働状況を表示します。 |