ヘルスチェック定義ファイル
形式
[JP1_EVENT] OUTPUT={YES | NO} RECOVER={YES | NO} [SYSLOG] OUTPUT={YES | NO} RECOVER={YES | NO} [OTHER_HOSTS] INTERVAL=他ホスト監視間隔(秒) TIMEOUT=通信タイムアウト時間(秒) STOP_CHECK={YES | NO} ERROR_DETAIL={YES | NO} POLLENDMSG={YES | NO} HOST=ホスト名1,ホスト名2,... THRESHOLD={監視しきい値 | ホスト名:監視しきい値},... |
パラメーターの分類
- 必須パラメーター
-
なし
- 選択パラメーター
-
[OTHER_HOSTS]セクション
-
INTERVAL
-
TIMEOUT
-
ERROR_DETAIL
-
HOST
-
POLLENDMSG
-
THRESHOLD
-
格納先ディレクトリ
- Windowsの場合
-
インストール先フォルダ\conf\jbshc\
共有フォルダ\jp1base\conf\jbshc\(クラスタ運用時)
- UNIXの場合
-
/etc/opt/jp1base/conf/jbshc/
共有ディレクトリ/jp1base/conf/jbshc/(クラスタ運用時)
説明
ヘルスチェック機能の動作として,監視対象ホストやプロセスの監視間隔を設定しておくファイルです。
定義の反映時期
JP1/Baseを再起動,またはjbs_spmd_reloadコマンドを実行すると設定が有効になります。
記述内容
ヘルスチェック定義ファイル(jbshc.conf)には,次に示す規則があります。
-
行の先頭に#(0x23)を指定すると,その行はコメント行になります。
-
「=」「,」の前後,行頭,および行末にスペースまたはタブを入れないでください。これらを入れた場合,その行は無効になります。
-
改行だけの行は無効になります。
-
ヘルスチェック定義ファイルは,1行1,023バイト以内のテキストファイルです。
- [JP1_EVENT]
-
JP1イベントの発行に関するセクションです。
- OUTPUT={YES | NO}
-
ヘルスチェックで問題を検知した場合にJP1イベントを発行するかどうかを指定します。「YES」または「NO」のどちらかを指定します。このパラメーターを省略した場合は,「YES」が仮定されます。
- RECOVER={YES | NO}
-
ヘルスチェックで検知した問題が回復した場合にJP1イベントを発行するかどうかを指定します。「YES」または「NO」のどちらかを指定します。このパラメーターを省略した場合は,「YES」が仮定されます。
なお,OUTPUTパラメーターに「NO」を指定した場合は,RECOVERパラメーターに「YES」を指定しても無効になります。
- [SYSLOG]
-
syslog,またはイベントログへのメッセージ出力に関するセクションです。
- OUTPUT={YES | NO}
-
ヘルスチェックで問題を検知した場合に,syslogまたはイベントログにメッセージを出力するかどうかを指定します。「YES」または「NO」のどちらかを指定します。このパラメーターを省略した場合は,「YES」が仮定されます。
- RECOVER={YES | NO}
-
ヘルスチェックで検知した問題が回復した場合に,syslogまたはイベントログにメッセージを出力するかどうかを指定します。「YES」または「NO」のどちらかを指定します。このパラメーターを省略した場合は,「YES」が仮定されます。
なお,OUTPUTパラメーターに「NO」を指定した場合は,RECOVERパラメーターに「YES」を指定しても無効になります。
- [OTHER_HOSTS]
-
他ホスト監視の動作に関するセクションです。
- INTERVAL=他ホスト監視間隔(秒)
-
他ホストを監視する間隔を指定します。指定できる値は,60〜7,200(秒)です。
監視間隔の目安を次に示します。
HOSTパラメーターに指定したホスト数×3(秒)
監視に掛かる時間は,1台当たり3秒を目安にしてください。ただし,ネットワーク状況や監視対象ホストの状態によって監視に掛かる時間は変わる場合があります。
監視間隔を目安よりも短く設定すると,障害を早期に検知できますが,指定した監視間隔の間に他ホストを監視し終わらないことがあります。このような場合,前回の監視処理が終了するまで待機します。
監視間隔を目安よりも長く設定すると,ネットワークやOSのリソースの消費を抑えられますが,障害の検知が遅れるおそれがあります。
このパラメーターを省略した場合は,300秒が仮定されます。
- 運用中,統合トレースログにKAVA7219-Wのメッセージが出力された場合
-
指定した監視間隔が短いおそれがあります。次に示す計算式で監視間隔を見積もってください。
現在の設定値 + ((KAVA7227-Iの出力時刻 - KAVA7219-Wの出力時刻) × 1.1)
- TIMEOUT=通信タイムアウト時間(秒)
-
監視元ホスト(マネージャー)から監視対象ホストへ監視(ポーリング)を開始してから応答が返ってくるまでのタイムアウト時間を指定します。
指定できる値は,1〜3,600(秒)です。このパラメーターを省略した場合は,60秒が仮定されます。
通信タイムアウト時間を経過しても監視対象ホストから応答がなかった場合,KAVA7223-EメッセージまたはKAVA7229-Wメッセージが出力されて監視が失敗します。
- STOP_CHECK={YES | NO}
-
監視対象ホストの起動・停止を監視するかどうかを指定します。「YES」または「NO」のどちらかを指定します。指定を省略した場合は,「NO」が仮定されます。
- ERROR_DETAIL={YES | NO}
-
他ホスト監視に失敗した場合に出力されるメッセージ(KAVA7223-EおよびKAVA7229-W)に,エラーの詳細情報を出力するかどうかを指定します。「YES」または「NO」のどちらかを指定します。指定を省略した場合は,「NO」が仮定されます。
- POLLENDMSG={YES | NO}
-
ポーリング完了メッセージ(KAVA7239-I)を出力するかどうかを指定します。「YES」または「NO」のどちらかを指定します。指定を省略した場合は,「NO」が仮定されます。
- HOST=ホスト名1,ホスト名2,...
-
他ホストを監視する場合に,監視対象ホストを指定します。自ホストだけを監視する場合は,指定は不要です。
複数のホストを指定する場合は,コンマで区切って指定します。HOSTパラメーターは複数指定できます。なお,監視できる他ホスト数は2,500台までです。2,501台以上を指定した場合は,2,501台目以降のホストは監視しません。ホスト名の大文字・小文字は区別されます。
ホスト名を複数指定する場合は,1行で記述する方法と複数行で記述する方法があります。次に示す定義は同じ定義内容になります。
-
1行で記述する方法
HOST=hostA,hostB,hostC
-
複数行で記述する方法
HOST=hostA
HOST=hostB
HOST=hostC
-
- THRESHOLD={監視しきい値 | ホスト名:監視しきい値},...
-
他ホスト監視で異常が発生したと判断するしきい値を指定します。監視しきい値に指定した回数分,監視に連続で失敗した場合,監視対象で異常が発生したと判断して,監視元ホスト(マネージャー)に異常を通知します。
監視しきい値に指定できる値は,1〜64です。このパラメーターを省略した場合は,「監視しきい値」の値として1が仮定されます。
- 監視しきい値
-
監視しきい値に指定した値が,すべての監視対象ホストに適用されます。指定を省略した場合は,1が仮定されます。複数指定した場合は,最初に指定した値が有効になります。
- ホスト名:監視しきい値
-
監視しきい値に指定した値が,ホスト名に指定した監視対象ホストだけに適用されます。ホスト名に指定できる文字数は,255バイト以内です。「ホスト名:監視しきい値」で指定した監視しきい値は,「監視しきい値」で指定した監視しきい値よりも優先されます。
ホスト名はHOSTパラメーターに指定したホスト名と,大文字・小文字を含めて完全に一致するようにしてください。同じホスト名を複数指定した場合は,最初に指定した値が有効になります。
監視しきい値を複数指定する場合は,1行で記述する方法と複数行で記述する方法があります。次に示す定義は同じ定義内容になります。
-
1行で記述する方法
THRESHOLD=1,hostA:3,hostB:5
-
複数行で記述する方法
THRESHOLD=1
THRESHOLD=hostA:3
THRESHOLD=hostB:5
注意事項
-
TIMEOUTパラメーターの通信タイムアウト時間をINTERVALパラメーターの他ホスト監視間隔よりも長く設定すると,監視間隔の時間内で監視が完了しないおそれがあります。通常の運用では,通信タイムアウト時間は初期設定の60(秒)のままで運用してください。通信タイムアウト時間を変更する場合は,他ホスト監視間隔よりも短くなるように設定してください。なお,通信タイムアウト時間を他ホスト監視間隔よりも長く設定するとKAVA7237-Wメッセージが出力されます。
-
ERROR_DETAILパラメーターが有効(YES)のときに,KAVA7223-EメッセージまたはKAVA7229-Wメッセージに出力されるエラーの詳細情報の内容と対処については,マニュアル「JP1/Base メッセージ」を参照してください。
-
THRESHOLDパラメーターのホスト名に指定できるホストは,HOSTパラメーターに指定した監視対象ホストが対象になります。監視対象ホストでないホストを指定した場合は,KAVA7238-Wメッセージが出力されます。
-
THRESHOLDパラメーターを設定した場合,設定した監視しきい値の分だけ監視対象ホストの異常の検知が遅れます。通常の運用では,監視しきい値は初期設定の1(回)のままで運用してください。「2.7.5(5) 一時的な障害で監視エラーが発生する場合の運用方法」に示すような監視障害が発生する場合は,監視しきい値の調整を検討してください。