Hitachi

JP1 Version 13 JP1/Integrated Management 3 - Manager 導入・設計ガイド


9.4.8 JP1/Baseのヘルスチェック機能

JP1/Baseのヘルスチェック機能は,JP1/Baseを構成する各プロセスがハングアップや異常終了となった場合に,異常を検知してメッセージやJP1イベントを発行し,オペレーターにJP1/Baseの回復を促すことを通知する機能です。この機能を利用することで,JP1/IMは,JP1/IMシステム構成下のJP1/Baseが正常に動作しているかどうかをチェックできます。なお,JP1/Baseのヘルスチェック機能はデフォルトでは無効となっています。設定を変更して有効にしてください。

注※ プロセスのハングアップとは,デッドロックや無限ループなどが原因で,プロセスが処理要求を受け付けなくなる状態です。

ここでは,JP1/Baseのヘルスチェック機能の概要について説明します。ヘルスチェック機能の仕組みや設定など,詳細についてはマニュアル「JP1/Base 運用ガイド」のヘルスチェック機能の設定の章を参照してください。

JP1/Baseのヘルスチェック機能には大きく分けて二つの役割があります。

なお,JP1/Baseのバージョンによっては,この機能が提供されていない場合があります。詳細は,マニュアル「JP1/Base 運用ガイド」を参照してください。

〈この項の構成〉

(1) 自ホスト上のJP1/Baseプロセスの状態監視

JP1/Baseのヘルスチェック機能を有効にすることで,自ホスト上のJP1/Baseプロセスのハングアップや異常終了を検知できるようになります。また,検知した内容はJP1/Baseの設定により,メッセージ情報としてOSのログ(Windowsイベントログやsyslog)やJP1イベントとしてイベントDBに登録されます。

自ホスト上のJP1/Baseプロセスの状態監視概要を次の図に示します。

図9‒20 自ホスト上のJP1/Baseプロセスの状態監視

[図データ]

JP1/Base自身の障害をJP1イベントとしてイベントDBに登録することで,JP1/IMによるJP1/Baseの障害監視も容易になります。

なお,ヘルスチェック機能が,ハングアップまたは異常終了すると,ほかのプロセスの状態監視ができなくなります。また,イベントサービスが,ハングアップまたは異常終了すると,JP1イベントの登録ができなくなります。

このような事態を回避したい場合は,他ホスト上のJP1/Baseのヘルスチェック機能を使ってこれら(イベントサービス,ヘルスチェック機能)の状態を監視するようにする必要があります。

(2) 他ホスト上のJP1/Baseプロセスの状態監視

JP1/Baseのヘルスチェック機能は,自ホスト上のJP1/Baseプロセスだけでなく,他ホスト上のJP1/Baseのヘルスチェック機能やイベントサービスの状態を監視できます。これにより,ヘルスチェック機能の障害によるJP1/Baseプロセスの障害検知漏れや,イベントサービスの障害によるJP1イベントの登録漏れを回避できます。

JP1/Baseのバージョンが09-10以降の場合,監視先が正常停止したときに監視を抑止することができます。詳細については,マニュアル「JP1/Base 運用ガイド」を参照してください。

他ホスト上のJP1/Baseプロセスの状態監視概要を次の図に示します。

図9‒21 他ホスト上のJP1/Baseプロセスの状態監視

[図データ]

上記図は,HostAでHostB,HostCのヘルスチェックやイベントサービスの状態監視をしていることを表しています。HostBのヘルスチェックに障害が発生した場合,HostAがそれを検知し,その内容をHostAのOSログやイベントDBに登録します。また,HostCのイベントサービスに障害が発生した場合,HostAがそれを検知し,その内容をHostAのOSログやイベントDBに登録します

注※ HostC上にあるイベントDBへのJP1イベント登録はできませんが,OSログへの登録はHostC上のヘルスチェック機能が正常であれば登録できます。

このようにして,JP1/BaseはJP1/Base自身の障害検知を行います。