JP1/Integrated Management - Manager システム構築・運用ガイド

[目次][用語][索引][前へ][次へ]


3.7.2 JP1/IM - Managerのヘルスチェック機能

JP1/IM - Managerでは,各機能のプロセスがデッドロックや無限ループなどで処理が停止(ハングアップ)したときに,その異常を検知し,JP1イベントを発行したり,通知コマンドを実行したりしてユーザーに通知する機能を提供しています。JP1/IM - Managerではこの機能をヘルスチェック機能と呼んでいます。

注※ プロセスのハングアップとは,デッドロックや無限ループなどが原因で,プロセスが処理要求を受け付けなくなる状態です。

ヘルスチェック機能を使用することで,デッドロックや無限ループなど,判断の難しいプロセスの状態異常をユーザーに通知でき,早期に対応を促すことができます。

JP1/IM - Managerのヘルスチェック機能の概要を次の図に示します。

図3-89 JP1/IM - Managerのヘルスチェック機能によるプロセスの状態監視概要

[図データ]

ヘルスチェック機能を有効にするとプロセスのハングアップ検知時に,OSのログ(Windowsイベントログ,syslog)や統合トレースログにメッセージ情報が出力されます。また,ヘルスチェック定義ファイル(jcohc.conf)で設定していれば,ハングアップ検知時にJP1イベントを発行したり,通知コマンドを実行したりします。

ヘルスチェック機能はJP1/Baseにもあり,こちらはJP1/Baseの各種プロセスが監視対象となります。JP1/IM - Managerのヘルスチェック機能とJP1/Baseのヘルスチェック機能を併用することで,JP1/IM - ManagerとJP1/IMシステム構成下のJP1/Baseのプロセス状態異常を早期に検知・対応できるようになります。

ヘルスチェック機能の監視対象プロセスや,有効および無効設定,機能の仕組みなどについては,次から説明します。

<この項の構成>
(1) ヘルスチェック機能の監視対象プロセス
(2) ヘルスチェック機能の有効および無効設定
(3) ヘルスチェック機能の仕組み

(1) ヘルスチェック機能の監視対象プロセス

JP1/IM - Managerのヘルスチェック機能の監視対象プロセスを次の表に示します。

表3-31 ヘルスチェック機能の監視対象プロセス

製品 機能 機能名 監視
JP1/IM - Manager イベントコンソールサービス evtcon
自動アクションサービス jcamain
イベントフロー制御サービス evflow
相関イベント発行サービス※1 evgen
セントラルスコープサービス※2 jcsmain
インシデント登録サービス※1 jcdmain
プロセス管理※2 jco_spmd
Windowsサービス制御※2 jco_service
JP1/Base イベントサービス※3 jevservice
イベントサービス以外 jbspluginなど

(凡例)
○:対応
−:未対応

注※1
デフォルトで無効になっている機能です。これらの機能を有効に変更し,ヘルスチェック機能を有効に設定すると,これらの機能もヘルスチェック機能の監視対象になります(これらの機能の有効・無効はjcoimdefコマンドで設定します)。

注※2
セントラルスコープサービス(jcsmain)はヘルスチェック機能に未対応です。プロセス管理(jco_spmd)は,JP1/IM - Managerのサービスに影響がないため監視しません。また,JP1/IM - Managerの起動・停止を行うプロセス(jco_service)は,サービスの起動・停止をするだけのプロセスであるため監視しません。

注※3
JP1/Baseのプロセスに関してJP1/IM - Managerのヘルスチェック機能で監視するのはマネージャー上のイベントサービスだけです。

参考
マネージャー上のJP1/BaseのそのほかのプロセスはJP1/Baseのヘルスチェック機能で監視できます。また,エージェント上のJP1/Baseプロセスの状態異常は,JP1/Baseのヘルスチェック機能を使って,JP1イベントとしてマネージャーホストに転送,登録できます。
詳細は,マニュアル「JP1/Base 運用ガイド」のヘルスチェック機能の設定の章の説明を参照してください。

(2) ヘルスチェック機能の有効および無効設定

ヘルスチェック機能は,インストール時点では有効になっていません。

ヘルスチェック定義ファイルのヘルスチェックの有効/無効の項目(ENABLE)を有効に設定してください。また,ハングアップ検知時にJP1イベントの発行や通知コマンドの実行をする場合には,イベント発行の項目(EVENT)を有効に,通知コマンド実行の項目(COMMAND)に実行するコマンドを設定してください。

なお,クラスタ運用で,ヘルスチェック機能による異常検知を契機に,系切り替えしたい場合は,クラスタ用の項目(FAILOVER)を有効に設定してください(デフォルトは無効です)。有効に設定すると,異常検知時にJP1/IM - Managerが停止します。ヘルスチェック機能(JP1/IM - Managerの停止)により,系切り替えができるようになります。

定義ファイルの詳細については,マニュアル「JP1/Integrated Management - Manager リファレンス ヘルスチェック定義ファイル(jcohc.conf)」(3. 定義ファイル)を参照してください。

(3) ヘルスチェック機能の仕組み

JP1/IM - Managerのヘルスチェック機能はプロセス同士の相互監視によって成立しています。

JP1/IM - Managerのヘルスチェックで監視を行うプロセスと,監視されるプロセスの対応を次の表に示します。

表3-32 監視を行うプロセスと監視されるプロセスの対応

監視を行うプロセス 監視されるプロセス
イベントコンソールサービス(evtcon) イベントフロー制御サービス(evflow)
自動アクションサービス(jcamain)
相関イベント発行サービス(evgen)
インシデント登録サービス(jcdmain)
イベントサービス(jevservice)
イベントフロー制御サービス(evflow) イベントコンソールサービス(evtcon)

注※ マネージャーホスト上のJP1/Baseのサービスです。


(a) プロセスの異常検知

JP1/IM - Managerのヘルスチェック機能では,監視を行うプロセスから監視されるプロセスに対して通信を行い,プロセスが正常に稼働していることを確認しています。プロセスの異常検知は次の2種類の方法で行われています。

プロセスの異常検知の方法を図に示すと次のようになります。

図3-90 プロセス間の通信の方法

[図データ]

(b) プロセスの異常発生の通知

プロセスの異常を検知すると,JP1/IM - ManagerがJP1イベントを発行したり,通知コマンドを実行したりして,異常が発生したことを通知します。

また,異常が発生したプロセスが正常状態に回復したときには,メッセージ「KAVB8061-I」が統合トレースログおよびWindowsイベントログ(syslog)に出力されます。JP1イベントの発行設定を有効にしている場合は,JP1イベント(イベントID:00002014)が発行されます。

注※
JP1/Baseのイベントサービスの異常時には,JP1/IM - Viewに対しダミーイベント(イベントDBに登録されないイベント)が発行されます。これは,JP1イベントが登録されるイベントサービスに異常が発生しているためです。
 
ポイント
JP1/IM - Managerのヘルスチェック機能を使用する場合には,通知コマンドの実行設定をしておくことをお勧めします。
これは,JP1イベントの発行だけでは,JP1/IM - Viewで監視していないときやイベントコンソールサービスに異常が発生したときに,ユーザーが異常に対して即時対応できない(JP1/IM側で検知していてもユーザー側にそのことが伝わらない)ためです。

[目次][前へ][次へ]


[他社商品名称に関する表示]

All Rights Reserved. Copyright (C) 2006, 2008, Hitachi, Ltd.