Hitachi

JP1 Version 12 JP1/Integrated Management 2 - Manager 導入・設計ガイド


8.2.3 ヘルスチェック機能の仕組み

JP1/IM - Managerのヘルスチェック機能はプロセス同士の相互監視によって成立しています。

JP1/IM - Managerのヘルスチェックで監視を行うプロセスと,監視されるプロセスの対応を次の表に示します。

表8‒3 監視を行うプロセスと監視されるプロセスの対応

監視を行うプロセス

監視されるプロセス

イベント基盤サービス(evflow

イベントコンソールサービス(evtcon

アクション実行サービス(jcamain

相関イベント発行サービス(evgen※1

イベントサービス(jevservice※2

イベントコンソールサービス(evtcon

イベント基盤サービス(evflow

注※1 統合監視DBを使用しない場合のサービスです。

注※2 マネージャー上のJP1/Baseのサービスです。

〈この項の構成〉

(1) プロセスの異常検知

JP1/IM - Managerのヘルスチェック機能では,監視を行うプロセスから監視されるプロセスに対して通信を行い,プロセスが正常に稼働していることを確認しています。

プロセスの異常検知は,監視対象のプロセスに対し,定期的な信号を送信することで確認します。信号を送信してから,指定した間隔より長く監視対象のプロセスが無応答だったとき,そのプロセスを異常と判断します。

信号を送信する間隔および異常と判断する無応答回数は,監視されるプロセスによって次のように異なります。

表8‒4 プロセスによる違い

監視されるプロセス

送信する間隔※1

無応答回数※2

イベントサービス(jevservice

60〜3,600秒

1〜60回

イベントサービス以外

60〜3,600秒

1〜60回

注※1

ヘルスチェック定義ファイルのNO_RESPONSE_TIME(無応答時間)で指定します。

注※2

ヘルスチェック定義ファイルのERROR_THRESHOLD(異常とみなす無応答回数)で指定します。

定義の詳細については,マニュアル「JP1/Integrated Management 2 - Manager コマンド・定義ファイル・APIリファレンス」の「ヘルスチェック定義ファイル(jcohc.conf)」を参照してください。

無応答を検知したあとのJP1/IM - Managerの動作を次に示します。

プロセスの異常検知の方法を図に示すと次のようになります。

図8‒3 プロセス間の通信の方法

[図データ]

(2) プロセスの異常発生の通知

JP1/IM - Managerのヘルスチェック機能を有効にしている場合,JP1/IM - Managerは,プロセスの異常を検知すると,異常が発生したことを通知するために,次の処理を行います。

また,異常が発生したプロセスが正常状態に回復したときには,JP1/IM - Managerの監視対象プロセスの場合はKAVB8061-Iメッセージを,JP1/Baseのイベントサービスの場合はKAVB8063-Iメッセージを,統合トレースログおよびWindowsイベントログ(syslog)に出力します。JP1イベントの発行設定を有効にしている場合は,JP1イベント(イベントID:00002014)を発行します。

メモ
  • イベントIDが00002013のJP1イベントは,JP1/IM - Viewに対して発行されるダミーイベント(イベントDBに登録されないイベント)です。JP1イベントが登録されるイベントサービスに異常が発生しているためダミーイベントを発行します。

  • JP1/IM - Managerのヘルスチェック機能を使用する場合には,通知コマンドの実行設定をしておくことをお勧めします。

    これは,JP1イベントの発行だけでは,JP1/IM - Viewで監視していないときやイベントコンソールサービスに異常が発生したときに,ユーザーが異常に対して即時対応できない(JP1/IM側で検知していてもユーザー側にそのことが伝わらない)ためです。