Hitachi

高信頼化システム監視機能 HAモニタ AIX(R)編


4.2.2 両系が障害を同時に検出した場合の系切り替え

実行系と待機系の両方が障害を同時に検出した場合,同時に系のリセットを発行し,実行系と待機系の両方が停止してしまうおそれがあります。そのため,HAモニタでは,優先して系のリセットをする系(リセット優先系)を決定しておく機能があります。実行系と待機系の両方が停止してしまうおそれがある構成については,「3.3.1 系の同時リセットの防止」を参照してください。

ここでは,実行系と待機系の両方が障害を同時に検出した場合に,HAモニタがどのように系切り替えをするか,について説明します。両系が同時に系障害を検出した場合の,HAモニタの処理の流れを,次の図に示します。

図4‒12 両系が障害を同時に検出した場合の処理の流れ

[図データ]

注※1

HAモニタの環境設定のstandbyresetオペランドで指定します。

注※2

HAモニタの環境設定のcpudownオペランドで指定します。onlineを指定すると実行系を,standbyを指定すると待機系をリセット優先系に指定します。また,systemを指定するとリセット優先系を決めません。

注※3

HAモニタの環境設定のaddressオペランドで指定します。

注※4

リセット要求を発行したあとに待つ時間(10秒)は,機種によって異なります。

以降,図に示した「ユーザがリセット優先系を指定する設定か」どうかによる,系切り替え処理の違いについて説明します。

〈この項の構成〉

(1) ユーザがリセット優先系を指定するときの系切り替え

ユーザがHAモニタの環境設定でリセット優先系を指定しておくと,両方の系が同時に障害を検出した場合,リセット優先系が優先的に他系をリセットします。リセット優先系ではない系は,障害を検出してから10秒間(機種によって異なる)待ったあと,リセット要求を発行します。ただし,リセット優先系に指定されていても,起動中のサーバが他系より多いか少ないかによって,リセット優先系が変わる場合があります。

(2) ユーザがリセット優先系を指定しないときの系切り替え

ユーザがHAモニタの環境設定でリセット優先系を指定しない設定にしておくと,両方の系が同時に障害を検出した場合,HAモニタは両系から同時にリセット要求を発行します。このとき,系切替機構が先に受け付けたリセット要求だけを処理することで,同時リセットを防止します。リセット優先系を指定しない運用の場合,どちらの系もリセット発行を待たないため,系切り替えに掛かる時間が短縮されます。

この運用は,相互系切り替え構成の場合で,系切替機構がTHE-HA-0043(03-15以降)のときに選べます。ただし,すべての監視パスに障害が発生した場合に,どちらかの系に系切り替えをしたいときは,ユーザがリセット優先系を指定してください。

ユーザがリセット優先系を指定しない場合,リセット時に同じハードウェアマネージメントコンソールを使用するよう,リセットパスを構成してください。ユーザがリセット優先系を指定しない場合のリセットパス構成については,「(5) ユーザがリセット優先系を指定しない場合の注意」を参照してください。