実行用アダプタの状態監視中にactive以外の状態を検出すると,HAモニタ/CLUSTERはLANに発生した障害をクラスタスイッチ障害とアダプタ障害に分類します。分類は,実行用アダプタの状態監視の結果と,交代用アダプタのヘルスチェックの結果を組み合わせて行います。障害の分類とHAモニタ/CLUSTERの処理の関係を,次の表に示します。
表5-1 障害の分類とHAモニタ/CLUSTERの処理の関係
実行用アダプタの状態 | 交代用アダプタの状態 | LAN障害の分類 | HAモニタ/CLUSTERの処理 |
---|---|---|---|
huberr | active | クラスタスイッチ障害 | HS-LinkドライバがLANの切り替えに成功したため,切り替え漏れをチェックします。 |
inactive | HS-LinkドライバがLANの切り替えに失敗したため,何もしません。 | ||
retry-he | |||
retry-ae | |||
retry | |||
retry-ae | inactive | アダプタ障害 | サーバ対応の環境設定の内容に従ってLANを切り替えます。 |
huberr | 何もしません。 | ||
adperr |
注 実行用アダプタの状態が「active」または「inactive」の場合は,それぞれLANに加入中または未加入中のため,HAモニタ/CLUSTERは何もしません。実行用アダプタの状態監視では,「adperr」は検出しません。
実行用クラスタスイッチに障害が発生し,すべての系が通信できない状態を,クラスタスイッチ障害といいます。
クラスタスイッチ障害は,HS-Linkドライバがクラスタスイッチを切り替えることで,LANを切り替えて回復させます。HAモニタ/CLUSTERは,状態監視で検出した次の事象から,クラスタスイッチの切り替えが成功したと判断します。
切り替えが成功したと判断すると,HAモニタ/CLUSTERは,HS-Linkドライバが交代用クラスタスイッチへの切り替え漏れを起こした系がないかチェックします。チェックは,自系のHAモニタ/CLUSTERが検出したアダプタの状態と,他系のHAモニタ/CLUSTERが検出したアダプタの状態とを比較して行います。比較の結果に相違があった場合は,その系が切り替え漏れを起こしたと判断し,その系のHAモニタ/CLUSTERにクラスタスイッチを切り替えさせます。
HS-Linkドライバがクラスタスイッチの切り替えに失敗した場合,HAモニタ/CLUSTERは何もしません。システムダウン後にユーザが障害の原因を取り除いて,システムを再起動してください。
クラスタスイッチ障害の検出と回復の流れを,次に示します。
図5-3 クラスタスイッチの正常稼働
図5-4 クラスタスイッチ障害の検出と切り替え
図5-5 切り替え漏れのチェック
図5-6 クラスタスイッチの切り替え
実行用クラスタスイッチに接続されたアダプタに障害が発生し,自系だけが通信できない状態を,アダプタ障害といいます。HAモニタ/CLUSTERは,状態監視で検出した次の事象から,アダプタ障害が発生したと判断します。
アダプタ障害が発生したと判断すると,HAモニタ/CLUSTERがLANを切り替えて回復させます。LANの切り替え方法には次の種類があり,サーバ対応の環境設定のadp_recoveryオペランドでの指定値に従います。
なお,HAモニタ/CLUSTERは,交代用アダプタの状態がhuberrまたはadperrだった場合にも,実行用アダプタの状態がretry-aeになるとアダプタ障害が発生したと判断します。ただし,この場合は交代用アダプタも障害状態であるため,実行用クラスタスイッチを交代用に切り替える方法ではLANを切り替えられません。計画系切り替えを実行して,障害が発生していないアダプタを使用しているサーバに切り替えるか,システムダウン後にユーザが障害の原因を取り除いて,システムを再起動してください。