4.4 稼働監視システム自身の障害を検知する機能

Performance Managementには,監視エージェントや監視エージェントが稼働するホストの稼働状態を確認する機能があります。これをヘルスチェック機能と呼びます。ヘルスチェック機能を利用すると,監視エージェントによって監視対象を正しく監視できているか,監視エージェントが稼働するホストが稼働しているかを知ることができます。また,稼働状態の監視結果にアラームを設定することで,PFM - Agentが正しく稼働していないことを検知したときやホストの停止を検知したときにアラームイベントを発生させ,メール送信などのアクションを実行させることができます。

また,Performance Managementには,稼働監視システム上で動作するPerformance Managementのサービスの詳細な稼働状態を確認する機能があります。これをステータス管理機能と呼びます。

なお,ヘルスチェック機能によって監視エージェントの稼働状態を監視するには,ステータス管理機能を使用します。このため,対象となる監視エージェントがステータス管理機能に対応したバージョンであり,ステータス管理機能が有効になっている必要があります。ホストの稼働状態を監視する場合は前提となる条件はありません。ヘルスチェック機能による稼働状態の確認の概要を次の図に示します。

図4-20 ヘルスチェック機能による稼働状態の確認の概要

[図データ]

ヘルスチェック機能では,次の2段階の監視ができます。

ヘルスチェック機能では,ヘルスチェックエージェントという稼働状態を監視するための専用のエージェントを使用して,監視エージェントや監視エージェントが稼働するホストの稼働状態を監視します。ヘルスチェックエージェントは,ヘルスチェック機能を有効にすることでPFM - Managerの起動時に起動します。ヘルスチェックエージェントは,監視エージェントのサービスや監視エージェントが稼働するホストの稼働状態を,一定の周期で確認し,確認結果をPFM - Web Console上に表示することでシステム管理者に稼働状態の変化を知らせます。ヘルスチェック機能の設定方法については,「19.2.1 ヘルスチェック機能の設定」を参照してください。稼働状態の確認方法については,「19.2.2 稼働状態の確認方法」を参照してください。

監視結果はイベント(ヘルスチェックイベント)として発行されるほか,パフォーマンスデータの形式でも収集されるため,必要に応じてアラームを設定し,アラームに対するアクションも設定できます。これによって,エージェント稼働状態の変化を契機としたJP1イベント発行やコマンド実行,SNMPトラップ発行およびEメール送信などができます。JP1イベントやSNMPトラップを利用することで,JP1/IM,NNMなどの統合運用管理製品と連携できます。

また,稼働状態の監視結果は,ヘルスチェックエージェントの設定によって,PDレコードタイプとしてStoreデータベースに格納できます。このため,ヘルスチェックエージェントのレポート機能を利用して現在および過去の稼働状態を参照できます。なお,ヘルスチェックエージェントのStoreデータベースへ格納するとき,使用するStoreバージョンの選択やデータの保存期間などを通常のパフォーマンスデータと同様に設定,管理できます。収集されたデータの管理方法については,「10. 稼働監視データの管理」を参照してください。ヘルスチェック機能での監視結果のデータ管理を次の図に示します。

図4-21 ヘルスチェック機能での監視結果のデータ管理

[図データ]

一方,ステータス管理機能だけを利用して,Performance Managementのサービスの状態を確認できます。ステータス管理機能が有効の場合,PFM - ManagerおよびPFM - Base上で動作するすべてのサービスは,自身の状態をステータスファイルに登録します。システム管理者は,ステータス管理サービス(Status Serverサービス)を使ってステータスファイルの内容を確認することで,サービスの状態を知ることができます。ステータスファイルの内容を確認するには,運用コマンド(jpcctrl listコマンド)を実行します。ステータス管理機能によるサービスの状態確認の概要を次の図に示します。

図4-22 ステータス管理機能によるサービスの状態確認の概要

[図データ]

ステータス管理機能の設定方法については,「19.3.1 ステータス管理機能の設定」を参照してください。

参考 ステータス管理機能が無効の場合のステータス管理
ステータス管理機能が無効の場合は,PFM - ManagerがPFM - Agentへの通信に対する応答の有無によってサービスの状態を判定します。また,PFM - AgentのIPアドレスやポート番号などのネットワーク情報をPFM - Managerが一元管理します。そのため,障害時やサービスの起動処理中などでPFM - Managerと通信できない場合やPFM - Agentがスタンドアロンモードで起動している場合には,サービスの状態を確認できません。
ステータス管理機能が無効の場合,サービス起動中や停止中にjpcctrl listコマンドでステータスを確認すると,サービスの状態を確認できない場合があります。サービスの状態を確認する必要があるときは,ステータス管理機能を有効にしてください。ステータス管理機能が無効の場合に,Performance Managementのステータスを確認した場合の例を次の図に示します。

図4-23 ステータス管理機能が無効の場合の例

[図データ]

jpcctrl listコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。