9.4.8 JP1/Baseのヘルスチェック機能
JP1/Baseのヘルスチェック機能は,JP1/Baseを構成する各プロセスがハングアップ※や異常終了となった場合に,異常を検知してメッセージやJP1イベントを発行し,オペレーターにJP1/Baseの回復を促すことを通知する機能です。この機能を利用することで,JP1/IMは,JP1/IMシステム構成下のJP1/Baseが正常に動作しているかどうかをチェックできます。なお,JP1/Baseのヘルスチェック機能はデフォルトでは無効となっています。設定を変更して有効にしてください。
注※ プロセスのハングアップとは,デッドロックや無限ループなどが原因で,プロセスが処理要求を受け付けなくなる状態です。
ここでは,JP1/Baseのヘルスチェック機能の概要について説明します。ヘルスチェック機能の仕組みや設定など,詳細についてはマニュアル「JP1/Base 運用ガイド」のヘルスチェック機能の設定の章を参照してください。
JP1/Baseのヘルスチェック機能には大きく分けて二つの役割があります。
-
自ホスト上のJP1/Baseプロセスの状態監視
-
他ホスト上のJP1/Baseプロセスの状態監視
なお,JP1/Baseのバージョンによっては,この機能が提供されていない場合があります。詳細は,マニュアル「JP1/Base 運用ガイド」を参照してください。
(1) 自ホスト上のJP1/Baseプロセスの状態監視
JP1/Baseのヘルスチェック機能を有効にすることで,自ホスト上のJP1/Baseプロセスのハングアップや異常終了を検知できるようになります。また,検知した内容はJP1/Baseの設定により,メッセージ情報としてOSのログ(Windowsイベントログやsyslog)やJP1イベントとしてイベントDBに登録されます。
自ホスト上のJP1/Baseプロセスの状態監視概要を次の図に示します。
JP1/Base自身の障害をJP1イベントとしてイベントDBに登録することで,JP1/IMによるJP1/Baseの障害監視も容易になります。
なお,ヘルスチェック機能が,ハングアップまたは異常終了すると,ほかのプロセスの状態監視ができなくなります。また,イベントサービスが,ハングアップまたは異常終了すると,JP1イベントの登録ができなくなります。
このような事態を回避したい場合は,他ホスト上のJP1/Baseのヘルスチェック機能を使ってこれら(イベントサービス,ヘルスチェック機能)の状態を監視するようにする必要があります。
(2) 他ホスト上のJP1/Baseプロセスの状態監視
JP1/Baseのヘルスチェック機能は,自ホスト上のJP1/Baseプロセスだけでなく,他ホスト上のJP1/Baseのヘルスチェック機能やイベントサービスの状態を監視できます。これにより,ヘルスチェック機能の障害によるJP1/Baseプロセスの障害検知漏れや,イベントサービスの障害によるJP1イベントの登録漏れを回避できます。
JP1/Baseのバージョンが09-10以降の場合,監視先が正常停止したときに監視を抑止することができます。詳細については,マニュアル「JP1/Base 運用ガイド」を参照してください。
他ホスト上のJP1/Baseプロセスの状態監視概要を次の図に示します。
上記図は,HostAでHostB,HostCのヘルスチェックやイベントサービスの状態監視をしていることを表しています。HostBのヘルスチェックに障害が発生した場合,HostAがそれを検知し,その内容をHostAのOSログやイベントDBに登録します。また,HostCのイベントサービスに障害が発生した場合,HostAがそれを検知し,その内容をHostAのOSログやイベントDBに登録します※。
注※ HostC上にあるイベントDBへのJP1イベント登録はできませんが,OSログへの登録はHostC上のヘルスチェック機能が正常であれば登録できます。
このようにして,JP1/BaseはJP1/Base自身の障害検知を行います。