5.2.2 HAモニタ/CLUSTERのLANの切り替え

実行用アダプタの状態監視中にactive以外の状態を検出すると,HAモニタ/CLUSTERはLANに発生した障害をクラスタスイッチ障害とアダプタ障害に分類します。分類は,実行用アダプタの状態監視の結果と,交代用アダプタのヘルスチェックの結果を組み合わせて行います。障害の分類とHAモニタ/CLUSTERの処理の関係を,次の表に示します。

表5-1 障害の分類とHAモニタ/CLUSTERの処理の関係

実行用アダプタの状態交代用アダプタの状態LAN障害の分類HAモニタ/CLUSTERの処理
huberractiveクラスタスイッチ障害HS-LinkドライバがLANの切り替えに成功したため,切り替え漏れをチェックします。
inactiveHS-LinkドライバがLANの切り替えに失敗したため,何もしません。
retry-he
retry-ae
retry
retry-aeinactiveアダプタ障害サーバ対応の環境設定の内容に従ってLANを切り替えます。
huberr何もしません。
adperr

注 実行用アダプタの状態が「active」または「inactive」の場合は,それぞれLANに加入中または未加入中のため,HAモニタ/CLUSTERは何もしません。実行用アダプタの状態監視では,「adperr」は検出しません。


<この項の構成>
(1) クラスタスイッチ障害の回復
(2) アダプタ障害の回復

(1) クラスタスイッチ障害の回復

実行用クラスタスイッチに障害が発生し,すべての系が通信できない状態を,クラスタスイッチ障害といいます。

クラスタスイッチ障害は,HS-Linkドライバがクラスタスイッチを切り替えることで,LANを切り替えて回復させます。HAモニタ/CLUSTERは,状態監視で検出した次の事象から,クラスタスイッチの切り替えが成功したと判断します。

切り替えが成功したと判断すると,HAモニタ/CLUSTERは,HS-Linkドライバが交代用クラスタスイッチへの切り替え漏れを起こした系がないかチェックします。チェックは,自系のHAモニタ/CLUSTERが検出したアダプタの状態と,他系のHAモニタ/CLUSTERが検出したアダプタの状態とを比較して行います。比較の結果に相違があった場合は,その系が切り替え漏れを起こしたと判断し,その系のHAモニタ/CLUSTERにクラスタスイッチを切り替えさせます。

HS-Linkドライバがクラスタスイッチの切り替えに失敗した場合,HAモニタ/CLUSTERは何もしません。システムダウン後にユーザが障害の原因を取り除いて,システムを再起動してください。

クラスタスイッチ障害の検出と回復の流れを,次に示します。

  1. クラスタスイッチの正常稼働

    図5-3 クラスタスイッチの正常稼働

    [図データ]

    クラスタスイッチが正常に稼働しているときは,実行用アダプタからは「active」,交代用アダプタからは「inactive」の結果が返されます。HAモニタ/CLUSTERが認識している実行用クラスタスイッチの名称はHOです。
  2. クラスタスイッチ障害の検出と切り替え

    図5-4 クラスタスイッチ障害の検出と切り替え

    [図データ]

    クラスタスイッチに障害が発生すると,HS-Linkドライバがクラスタスイッチおよびアダプタを切り替えます。切り替えが成功すると,実行用アダプタだったhs0からは「huberr」が,交代用アダプタだったhs1からは「active」が返されます。切り替えが成功した系のHAモニタ/CLUSTERは実行用クラスタスイッチ名称:H1を認識します。
  3. 切り替え漏れのチェック

    図5-5 切り替え漏れのチェック

    [図データ]

    他系のHS-Linkドライバでの切り替え漏れをチェックするため,HAモニタ/CLUSTERが認識している実行用クラスタスイッチの名称を,他系のものと比較します。
  4. クラスタスイッチの切り替え

    図5-6 クラスタスイッチの切り替え

    [図データ]

    認識しているクラスタスイッチ名称が異なると,切り替え漏れがあったと判断し,その系に切り替えを指示します。

(2) アダプタ障害の回復

実行用クラスタスイッチに接続されたアダプタに障害が発生し,自系だけが通信できない状態を,アダプタ障害といいます。HAモニタ/CLUSTERは,状態監視で検出した次の事象から,アダプタ障害が発生したと判断します。

アダプタ障害が発生したと判断すると,HAモニタ/CLUSTERがLANを切り替えて回復させます。LANの切り替え方法には次の種類があり,サーバ対応の環境設定のadp_recoveryオペランドでの指定値に従います。

なお,HAモニタ/CLUSTERは,交代用アダプタの状態がhuberrまたはadperrだった場合にも,実行用アダプタの状態がretry-aeになるとアダプタ障害が発生したと判断します。ただし,この場合は交代用アダプタも障害状態であるため,実行用クラスタスイッチを交代用に切り替える方法ではLANを切り替えられません。計画系切り替えを実行して,障害が発生していないアダプタを使用しているサーバに切り替えるか,システムダウン後にユーザが障害の原因を取り除いて,システムを再起動してください。