JP1/Base 運用ガイド
ヘルスチェック機能は,JP1/Base自体の障害を検知することを目的としていますが,ヘルスチェック機能自体にハングアップなどの異常が生じると,JP1/Baseの障害を検知できなくなります。また,JP1/IM - Managerを利用したシステムでは,イベントサービスに異常が生じると,JP1イベントを発行,および転送できないため,異常を検知しても上位ホストへ通知できなくなります。
JP1/Baseのヘルスチェック機能では,自ホストのプロセスの異常を検知,または通知する手段がなくなった場合に備え,他ホストからヘルスチェック機能およびイベントサービスのプロセスの状態を監視できます。
他ホストを監視したい場合は,動作定義ファイルに監視対象ホストと監視間隔を指定します。一台のホストで1,024台まで監視できます。
JP1/IM - Manager,またはJP1/AJS2を利用したシステムでの他ホストの監視方法,および他ホストを監視する場合の運用方法について説明します。
- <この項の構成>
- (1) JP1/IM - Managerを利用したシステムでの他ホスト監視
- (2) JP1/AJS2を利用したシステムでの他ホスト監視
- (3) 他ホストを監視する場合の運用方法
(1) JP1/IM - Managerを利用したシステムでの他ホスト監視
監視対象ホストを指定すると,他ホストのJP1/Baseのヘルスチェック機能,およびイベントサービスが正常に稼働しているかどうかを監視できます。
次の図に示す構成例を基に,JP1/IM - Managerを利用したシステムでの他ホストの監視方法について説明します。
図9-4 JP1/IM - Managerを利用したシステムでの他ホスト監視の例
図の例では,各ホストで次のように設定されています。
ホスト 役割 他ホスト監視の設定 hostA マネージャーホスト hostB,hostXを監視する。 hostB サブマネージャーホスト hostA,hostY,hostZを監視する。 hostX エージェントホスト 設定なし。 hostY エージェントホスト 設定なし。 hostZ エージェントホスト 設定なし。 エージェントホストhostY,およびマネージャーホストhostAで,ヘルスチェック機能,およびイベントサービスに異常が生じた場合の処理について説明します。
- hostYのヘルスチェック機能に異常が生じた場合
- hostBのヘルスチェック機能が異常を検知してJP1イベントを発行します。発行されたJP1イベントはhostAに転送され,JP1/IM - ViewにhostYの異常通知が表示されます。
- hostYのイベントサービスに異常が生じた場合
- hostBのヘルスチェック機能が異常を検知してJP1イベントを発行します。hostYのヘルスチェック機能は異常を検知しますが,JP1イベントを発行できません。hostBで発行されたJP1イベントはhostAに転送され,JP1/IM - ViewにhostYの異常通知が表示されます。
- hostAのヘルスチェック機能に異常が生じた場合
- hostBのヘルスチェック機能が異常を検知してJP1イベントを発行します。発行されたJP1イベントはhostAに転送され,JP1/IM - ViewにhostAの異常通知が表示されます。
- hostAのイベントサービスに異常が生じた場合
- hostAのJP1/IM - Managerでヘルスチェック機能を有効にしている場合は,JP1/IM - Managerのヘルスチェック機能がhostAのイベントサービスの異常を検知し,JP1/IM - View上に異常を通知します。
(2) JP1/AJS2を利用したシステムでの他ホスト監視
監視対象ホストを指定すると,他ホストのJP1/Baseのヘルスチェック機能が正常に稼働しているかどうかを監視できます。
JP1/AJS2を利用したシステムで,JP1/Baseのプロセスの異常をマネージャーホストに通知したい場合は,JP1/Cm2/OAAおよびJP1/Cm2/NNMを利用して,ヘルスチェック機能がsyslogまたはイベントログに出力するメッセージを監視し,マネージャーホストへ通知してください。
次の図に示す構成例を基に,JP1/AJS2を利用したシステムでの他ホストの監視方法について説明します。
図9-5 JP1/AJS2を利用したシステムでの他ホスト監視の例
図の例では,各ホストで次のように設定されています。
ホスト 役割 他ホスト監視の設定 hostA マネージャーホスト hostX,hostYを監視する。 hostX エージェントホスト hostAを監視する。 hostY エージェントホスト 設定なし。 エージェントホストhostX,およびマネージャーホストhostAのヘルスチェック機能に異常が生じた場合の処理について説明します。
- hostXのヘルスチェック機能に異常が生じた場合
- hostAのヘルスチェック機能が異常を検知し,syslog,またはイベントログにメッセージを出力します。hostAのJP1/Cm2/OAAがsyslog,またはイベントログに出力されたメッセージを検知し,JP1/Cm2/NNMに通知します。JP1/Cm2/NNMに,hostXの異常通知が表示されます。
- hostAのヘルスチェック機能に異常が生じた場合
- hostXのヘルスチェック機能が異常を検知し,syslog,またはイベントログにメッセージを出力します。hostXのJP1/Cm2/OAAがsyslog,またはイベントログに出力されたメッセージを検知し,JP1/Cm2/NNMに通知します。JP1/Cm2/NNMに,hostAの異常通知が表示されます。
(3) 他ホストを監視する場合の運用方法
他ホストを監視する場合の運用方法について説明します。
(a) 監視対象ホストの数が多い場合の運用方法
一台のホストで複数のホストを監視する場合,ヘルスチェック機能は一台ずつホストのプロセス状況を確認します。1台のホストの監視に掛かる時間は3秒程度です。そのため,一台のホストが監視するホスト数が多いと監視に時間が掛かります。
例えば,1台のホストで200台のホスト監視すると,すべてのホストを監視し終わるまでに600秒程度掛かります。監視時間を短縮したい場合は,監視対象ホストをグループに分け,グループごとに擬似的なマネージャーホストを決めて監視してください。
図9-6 200台のホストを監視する場合の運用例
図の例では監視対象ホストを20台ずつのグループに分けています。また,マネージャーホストhostAから擬似的なマネージャーホストhost1,host21などを監視するよう設定します。グループごとに監視すると,監視に掛かる時間を60秒程度に短縮できます。
(b) 階層管理した構成で障害が発生した場合の運用方法
監視対象ホストを階層管理している構成で,障害が発生した場合の運用方法について次の図で説明します。
図9-7 障害が発生した場合の運用例
hostBのヘルスチェック機能やイベントサービスに障害が発生した場合,hostBが監視しているhostDやhostEの異常を検知,および通知できなくなります。
hostBが短時間で復旧した場合は,hostBの停止中にhostDやhostEで障害が発生してJP1イベントが発行されても,JP1イベントの転送のリトライによって,hostBが回復した時点でJP1イベントが転送されます。hostBの復旧に長時間掛かる場合は,hostBが復旧するまでの間,hostAからhostD,hostEを直接監視するようヘルスチェック定義ファイルを設定し直す必要があります。
このように階層管理している構成では,サブマネージャーホストの障害に備えて,マネージャーホストから直接エージェントホストを監視するよう定義したヘルスチェック定義ファイルをあらかじめ用意しておくと便利です。
(c) 監視間隔の見直し
他ホストを監視する場合は,ヘルスチェック定義ファイルで監視間隔を指定できます。運用を開始する前に試運転をして,指定した監視間隔が妥当かどうか確認してください。このとき,統合トレースログにKAVA7219-Wのメッセージが出力された場合は,指定した監視間隔が短いおそれがあります。「9.6 ヘルスチェック定義ファイル(jbshc.conf)の詳細」に記載してある見積もり式を参照して,監視間隔を設定し直してください。
All Rights Reserved. Copyright (C) 2006, 2008, Hitachi, Ltd.