Hitachi

高信頼化システム監視機能 HAモニタ Linux(R)(x86)編


4.2.2 両系が障害を同時に検出した場合の系切り替え

実行系と待機系の両方が障害を同時に検出した場合,同時に系のリセットを発行し,実行系と待機系の両方が停止してしまうおそれがあります。そのため,HAモニタでは,優先して系のリセットをする系(リセット優先系)を決定しておく機能があります。実行系と待機系の両方が停止してしまうおそれがある構成については,「3.3.1 系の同時リセットの防止」を参照してください。

ここでは,実行系と待機系の両方が障害を同時に検出した場合に,HAモニタがどのように系切り替えをするか,について説明します。両系が同時に系障害を検出した場合の,HAモニタの処理の流れを,次の図に示します。

図4‒13 両系が障害を同時に検出した場合の処理の流れ

[図データ]

注※1

HAモニタの環境設定のstandbyresetオペランドで指定します。

注※2

HAモニタの環境設定のcpudownオペランドで指定します。onlineを指定すると実行系を,standbyを指定すると待機系をリセット優先系に指定します。また,systemを指定するとリセット優先系を決めません。

注※3

HAモニタの環境設定のaddressオペランドで指定します。

注※4

VMware ESXiで仮想化する場合は,40秒になります。

以降,図に示した「ユーザがリセット優先系を指定する設定か」どうかによる,系切り替え処理の違いについて説明します。

〈この項の構成〉

(1) ユーザがリセット優先系を指定するときの系切り替え

ユーザがHAモニタの環境設定でリセット優先系を指定しておくと,両方の系が同時に障害を検出した場合,リセット優先系が優先的に他系をリセットします。リセット優先系ではない系は,障害を検出してから20秒間(VMware ESXiで仮想化する場合は40秒間)待ったあと,リセット要求を発行します。ただし,リセット優先系に指定されていても,起動中のサーバが他系より多いか少ないかによって,リセット優先系が変わる場合があります。

(2) ユーザがリセット優先系を指定しないときの系切り替え

ユーザがHAモニタの環境設定でリセット優先系を指定しない設定にしておくと,両方の系が同時に障害を検出した場合,HAモニタは両系から同時にリセット要求を発行します。このとき,SVPが先に受け付けたリセット要求だけを処理することで,同時リセットを防止します。リセット優先系を指定しない運用の場合,どちらの系もリセット発行を待たないため,系切り替えに掛かる時間が短縮されます。

この運用は,相互系切り替え構成で,かつマシンの機種がBladeSymphonyでSVPがクラスタ管理機能に対応している場合に選べます。クラスタ管理機能については,ハードウェア関連のドキュメントを参照してください。ただし,すべての監視パスに障害が発生した場合に,どちらかの系に系切り替えをしたいときは,ユーザがリセット優先系を指定してください。

ユーザがリセット優先系を指定しない場合,リセットパスの設定,およびSVPの設定が必要です。詳細については,「6.7.1 設定に必要な情報(BladeSymphony)」および「(7) 相互系切り替え構成(リセット優先系を指定しない)」を参照してください。