7.10.2 ウォッチドッグタイマによる障害監視に必要な設定

ウォッチドッグタイマによる障害監視に必要な設定について,管理対象がWindowsサーバの場合とLinuxサーバの場合とに分けて説明します。

<この項の構成>
(1) Windowsサーバの場合
(2) Linuxサーバの場合

(1) Windowsサーバの場合

障害監視に必要な設定をするには,BMC環境設定ユティリティを使用します。障害監視をするかどうか,また監視周期や障害発生時の処理について設定できます。BMC環境設定ユティリティの詳細は,「3.16.1 管理対象がBladeSymphony(Windowsサーバ)の場合のBMCの設定」を参照してください。

例として,監視周期を「5」分に,障害発生時処理を「電源OFF」に設定している場合の動作を次に示します。

図7-10 ウォッチドッグタイムアウトの動作の例

[図データ]

上記の例では,指定値の3分の1の1分40秒ごとにResetコマンドが送信されます。指定値の5分以内にResetコマンドが送信されない場合に,ウォッチドッグタイムアウトが発生します。

なお,障害監視の実行中にAgentとBMCとの間で通信でエラーが発生した場合は,次のファイルにログが出力されます。

ログファイル
<ServerConductor(Agent)インストール先フォルダ>¥log¥@SmSvpWatchdog@.log
出力内容
SVP watchdog was not able to obtain a response from BMC once.
 
Agentが08-60よりも前のバージョンの場合

Resetコマンドは指定値の半分の間隔で送信されます。

(2) Linuxサーバの場合

障害監視に必要な設定をするには,smhaaeditコマンドの[2. BMC Configuration File]メニューを使用します。障害監視をするかどうか,また監視周期や障害発生時の処理について設定できます。smhaaeditコマンドの詳細は,「3.16.2(2) smhaaeditコマンドによるBMCの設定手順」を参照してください。

ウォッチドッグタイムアウトの動作は,「(1) Windowsサーバの場合」と同様です。

障害監視の実行中にAgentとBMCとの間で通信でエラーが発生した場合は,次のファイルにログが出力されます。

ログファイル
/var/opt/hitachi/system_manager/log/@svp@.log
出力内容
SVP watchdog was not able to obtain a response from BMC once.

 

Agentが08-60よりも前のバージョンの場合

Agentが08-60よりも前のバージョンの場合の動作は,次のようになります。

例として,ErrorWatchingIntervalを「5」分に,ProcessAtErrorを「2」(電源OFF)に設定している場合の動作を次に示します。

図7-11 ウォッチドッグタイムアウトの動作の例(08-60よりも前のバージョンの場合)

[図データ]

上記の例では,指定値の5分ごとにResetコマンドが送信されます。指定値の5分+5分の10分以内にResetコマンドが送信されない場合に,ウォッチドッグタイムアウトが発生します。