Hitachi

JP1 Version 11 JP1/Base 運用ガイド


ヘルスチェック定義ファイル

〈このページの構成〉

形式

[JP1_EVENT]

OUTPUT={YES | NO}

RECOVER={YES | NO}

[SYSLOG]

OUTPUT={YES | NO}

RECOVER={YES | NO}

[OTHER_HOSTS]

INTERVAL=他ホスト監視間隔(秒)

TIMEOUT=通信タイムアウト時間(秒)

STOP_CHECK={YES | NO}

ERROR_DETAIL={YES | NO}

POLLENDMSG={YES | NO}

HOST=ホスト名1,ホスト名2,...

THRESHOLD={監視しきい値 | ホスト名:監視しきい値},...

パラメーターの分類

必須パラメーター

なし

選択パラメーター

[OTHER_HOSTS]セクション

  • INTERVAL

  • TIMEOUT

  • ERROR_DETAIL

  • HOST

  • POLLENDMSG

  • THRESHOLD

ファイル名

jbshc.conf

格納先ディレクトリ

Windowsの場合

インストール先フォルダ\conf\jbshc\

共有フォルダ\jp1base\conf\jbshc\(クラスタ運用時)

UNIXの場合

/etc/opt/jp1base/conf/jbshc/

共有ディレクトリ/jp1base/conf/jbshc/(クラスタ運用時)

説明

ヘルスチェック機能の動作として,監視対象ホストやプロセスの監視間隔を設定しておくファイルです。

定義の反映時期

JP1/Baseを再起動,またはjbs_spmd_reloadコマンドを実行すると設定が有効になります。

記述内容

ヘルスチェック定義ファイル(jbshc.conf)には,次に示す規則があります。

[JP1_EVENT]

JP1イベントの発行に関するセクションです。

OUTPUT={YES | NO}

プロセスの状態が異常の場合にJP1イベントを発行するかどうかを指定します。「YES」または「NO」のどちらかを指定します。このパラメーターを省略した場合は,「YES」が仮定されます。

RECOVER={YES | NO}

プロセスの状態が回復した場合にJP1イベントを発行するかどうかを指定します。「YES」または「NO」のどちらかを指定します。このパラメーターを省略した場合は,「YES」が仮定されます。

なお,OUTPUTパラメーターに「NO」を指定した場合は,RECOVERパラメーターに「YES」を指定しても無効になります。

[SYSLOG]

syslog,またはイベントログへのメッセージ出力に関するセクションです。

OUTPUT={YES | NO}

プロセスの状態が異常の場合に,syslogまたはイベントログにメッセージを出力するかどうかを指定します。「YES」または「NO」のどちらかを指定します。このパラメーターを省略した場合は,「YES」が仮定されます。

RECOVER={YES | NO}

プロセスの状態が回復した場合に,syslogまたはイベントログにメッセージを出力するかどうかを指定します。「YES」または「NO」のどちらかを指定します。このパラメーターを省略した場合は,「YES」が仮定されます。

なお,OUTPUTパラメーターに「NO」を指定した場合は,RECOVERパラメーターに「YES」を指定しても無効になります。

[OTHER_HOSTS]

他ホスト監視の動作に関するセクションです。

INTERVAL=他ホスト監視間隔(秒)

他ホストを監視する間隔を指定します。指定できる値は,60〜7,200(秒)です。

監視間隔の目安を次に示します。

HOSTパラメーターに指定したホスト数×3(秒)

監視に掛かる時間は,1台当たり3秒を目安にしてください。ただし,ネットワーク状況や監視対象ホストの状態によって監視に掛かる時間は変わる場合があります。

監視間隔を目安よりも短く設定すると,障害を早期に検知できますが,指定した監視間隔の間に他ホストを監視し終わらないことがあります。このような場合,前回の監視処理が終了するまで待機します。

監視間隔を目安よりも長く設定すると,ネットワークやOSのリソースの消費を抑えられますが,障害の検知が遅れるおそれがあります。

このパラメーターを省略した場合は,300秒が仮定されます。

運用中,統合トレースログにKAVA7219-Wのメッセージが出力された場合

指定した監視間隔が短いおそれがあります。次に示す計算式で監視間隔を見積もってください。

現在の設定値 + ((KAVA7227-Iの出力時刻 - KAVA7219-Wの出力時刻) × 1.1)

TIMEOUT=通信タイムアウト時間(秒)

監視元ホスト(マネージャー)から監視対象ホストへ監視(ポーリング)を開始してから応答が返ってくるまでのタイムアウト時間を指定します。

指定できる値は,1〜3,600(秒)です。このパラメーターを省略した場合は,60秒が仮定されます。

通信タイムアウト時間を経過しても監視対象ホストから応答がなかった場合,KAVA7223-EメッセージまたはKAVA7229-Wメッセージが出力されて監視が失敗します。

STOP_CHECK={YES | NO}

監視対象ホストの起動・停止を監視するかどうかを指定します。「YES」または「NO」のどちらかを指定します。指定を省略した場合は,「NO」が仮定されます。

ERROR_DETAIL={YES | NO}

他ホスト監視に失敗した場合に出力されるメッセージ(KAVA7223-EおよびKAVA7229-W)に,エラーの詳細情報を出力するかどうかを指定します。「YES」または「NO」のどちらかを指定します。指定を省略した場合は,「NO」が仮定されます。

POLLENDMSG={YES | NO}

ポーリング完了メッセージ(KAVA7239-I)を出力するかどうかを指定します。「YES」または「NO」のどちらかを指定します。指定を省略した場合は,「NO」が仮定されます。

HOST=ホスト名1,ホスト名2,...

他ホストを監視する場合に,監視対象ホストを指定します。自ホストだけを監視する場合は,指定は不要です。

複数のホストを指定する場合は,コンマで区切って指定します。HOSTパラメーターは複数指定できます。なお,監視できる他ホスト数は2,500台までです。2,501台以上を指定した場合は,2,501台目以降のホストは監視しません。

ホスト名を複数指定する場合は,1行で記述する方法と複数行で記述する方法があります。次に示す定義は同じ定義内容になります。

  • 1行で記述する方法

    HOST=hostA,hostB,hostC

  • 複数行で記述する方法

    HOST=hostA

    HOST=hostB

    HOST=hostC

THRESHOLD={監視しきい値 | ホスト名:監視しきい値},...

他ホスト監視で異常が発生したと判断するしきい値を指定します。監視しきい値に指定した回数分,監視に連続で失敗した場合,監視対象で異常が発生したと判断して,監視元ホスト(マネージャー)に異常を通知します。

監視しきい値に指定できる値は,1〜64です。このパラメーターを省略した場合は,「監視しきい値」の値として1が仮定されます。

監視しきい値

監視しきい値に指定した値が,すべての監視対象ホストに適用されます。指定を省略した場合は,1が仮定されます。複数指定した場合は,最初に指定した値が有効になります。

ホスト名:監視しきい値

監視しきい値に指定した値が,ホスト名に指定した監視対象ホストだけに適用されます。ホスト名に指定できる文字数は,255バイト以内です。「ホスト名:監視しきい値」で指定した監視しきい値は,「監視しきい値」で指定した監視しきい値よりも優先されます。

ホスト名はHOSTパラメーターに指定したホスト名と,大文字・小文字を含めて完全に一致するようにしてください。同じホスト名を複数指定した場合は,最初に指定した値が有効になります。

監視しきい値を複数指定する場合は,1行で記述する方法と複数行で記述する方法があります。次に示す定義は同じ定義内容になります。

  • 1行で記述する方法

    THRESHOLD=1,hostA:3,hostB:5

  • 複数行で記述する方法

    THRESHOLD=1

    THRESHOLD=hostA:3

    THRESHOLD=hostB:5

注意事項