2.3.6 複数系間の同時リセットの防止

系の同時リセットとは,実行系と待機系の両方が同時に系のリセットをすることです。ここでは,一つの実行系に対して,複数の待機系がある構成の場合に,系の同時リセットを防止する方法について説明します。なお,この方法はAIX,HP-UX(PA-RISC),HP-UX(IPF),およびLinux(IPF)の場合だけ使用できます。

マルチスタンバイ機能を使用して,一つの実行サーバに対して複数の待機サーバを配置する構成では,複数系間の同時リセットを防止する必要があります。

<この項の構成>
(1) 複数系間で,系の同時リセットが起こるおそれがある構成
(2) リセット優先度の決定方法
(3) リセット優先度を指定した場合のリセットの発行の流れ
(4) 監視パスおよびリセットパスの信頼性の確保

(1) 複数系間で,系の同時リセットが起こるおそれがある構成

3台以上の系がある構成では,監視パスのネットワーク構成機器の障害などで系が分断されると,分断された個々のネットワーク間で別々に系障害を検出し,結果としてすべての系がリセットされてしまうおそれがあります。

この問題を回避するために,系切り替え構成全体に属するすべての系でリセット発行順序を一意に定める必要があります。このリセット発行順序をリセット優先度といいます。リセット優先度は,HAモニタの環境設定で指定します。

複数系間で系の同時リセットが起こるおそれがある構成には,次があります。

すべての系がリセットし合う構成を次の図に示します。

図2-25 すべての系がリセットし合う構成

[図データ]

(2) リセット優先度の決定方法

系切り替え構成全体に属するすべての系でリセット発行順序を一意に定めるため,リセット優先度を指定します。

HAモニタは,起動時に他系と接続した際,自系のリセット優先度を決定します。リセット優先度は,接続された系の中で,ホストアドレスの小さい系から順に優先度が高くなります。リセット優先度には0から31まであり,0がいちばん高い優先度とみなされます。

ホストアドレスとリセット優先度の関係を次の図に示します。この例では,系3に障害が発生した場合,ホストアドレスのいちばん小さい系1がリセットを発行します。

図2-26 ホストアドレスとリセット優先度の関係

[図データ]

系障害を検出した場合,リセット優先度が最も高い系がリセットを発行します。他系は,リセット優先度に従ってリセットの発行を一定時間待ちます。このリセット発行の待ち時間は,「各系のリセット優先度×10(秒)」で計算できます。

(3) リセット優先度を指定した場合のリセットの発行の流れ

リセット優先度を指定した場合の,リセットの発行の詳細について説明します。

リセット発行
系障害を検知した系は,自系のリセット優先度に従って,障害が発生した系にリセットを発行します。さらに接続しているすべての系にリセット発行を依頼します。リセット発行の依頼を受けた系は,自系のリセット優先度に従って,障害系のリセットを発行します。
リセット成功通知
リセットが成功した場合,リセットを発行した系は,すべての系に対してリセットの成功を通知します。系切り替えする待機サーバがあれば,系切り替えをします。
リセット成功通知を受信した系は,障害が発生した系に対してリセット発行待ちの状態であればリセット発行待ちを中断します。系切り替えをする待機サーバがあれば,系切り替えをします。
リセット失敗
リセットが失敗した場合,リセットを発行した系は他系からのリセット成功通知を待ちます。

リセットの発行の流れを次の図に示します。この例では,系2で障害が発生した場合で,系1からのリセットが失敗し,リセット発行待ち時間が過ぎたら系3がリセットを発行する流れを説明します。

図2-27 リセット優先度を指定した場合のリセットの発行の流れ

[図データ]

次に,リセット優先度を指定した場合のリセットの発行の流れの詳細を説明します。番号は,上記の図と対応しています。

  1. リセット指示とリセット依頼
    いちばん高いリセット優先度を持つ系1は,系2の系障害を検出すると,系2にリセットを指示します。また,他系に対してリセットを依頼します。
    系3は,系2の系障害を検出すると,系2のリセット発行を待ちます。
  2. リセット失敗
    系1からのリセット指示が失敗した場合,系1は他系からのリセット成功通知を待ちます。
  3. リセット指示
    系1からのリセット成功通知がなく,リセット優先度に応じたリセット待ち時間が過ぎると,系3は系2にリセットを指示します。
  4. リセット成功通知と系切り替え
    リセットが成功した場合,系3は,他系にリセット成功を通知し,系切り替えできる待機サーバがあれば,系切り替えをします。

(4) 監視パスおよびリセットパスの信頼性の確保

すべての系で同時に障害を検出しないよう,監視パスは必ず複線化して信頼性を確保してください。また,監視パスのヘルスチェックを必ず実施するよう設定し,監視パス障害時は,障害を速やかに取り除いてください。