18.16.1 プライマリノードでノード障害が発生した場合
(1) プライマリノードでノード障害が発生した場合のシステムの処理
プライマリノードでノード障害が発生した場合,セカンダリノードの1つがプライマリノードに切り替わり,障害が発生したプライマリノードはマルチノード構成から切り離されます。プライマリノードでノード障害が発生した場合のシステムの処理を次の図に示します。
- [説明]
-
プライマリノード(hadb01)でノード障害が発生した場合,セカンダリノードの1つをプライマリノードに切り替えて,障害が発生したノードはマルチノード構成から切り離されます。その後,プライマリノード(hadb02),セカンダリノード(hadb03),およびワーカーノード(hadb04,hadb05)で処理が継続されます。
なお,ワーカーノード(hadb04,hadb05)は,プライマリノードの切り替え先にはなりません。
HADBでは,HAモニタのマルチスタンバイ機能を使用して,プライマリノードを切り替えています。マルチスタンバイ機能とは,1つの実行系(プライマリノード)に対して,複数の待機系(セカンダリノード)を準備する機能のことです。セカンダリノードの優先順位(どのセカンダリノードがプライマリノードになるか)は,HAモニタのserversファイルのinitialおよびstandbypriオペランドで指定します。詳細については,マニュアルHAモニタ Linux(R)(x86)編のマルチスタンバイ機能を使用する場合のサーバと系の管理を参照してください。
(2) ノード障害が発生したときのHADB管理者の対処
ノード障害の原因を特定するために,「15.1 障害発生時の対処の流れ」を参照して対処してください。そこで説明している手順を,ノード障害が発生したノードで実施してください。
また,障害が発生したノードで,次のトラブルシュート情報を取得してください。
-
HADBサーバのトラブルシュート情報をadbinfogetコマンドで取得してください。
-
HAモニタのトラブルシュート情報をHAモニタのmontsコマンドで取得してください。
障害の原因を対処したあとに,マルチノード構成から切り離されたノードをマルチノード構成に復帰させることができます。マルチノード構成への復帰手順については,「18.16.3 マルチノード構成へのノードの復帰」を参照してください。
なお,マルチノード構成に復帰させたノードは必ずセカンダリノードになります。
(3) 注意事項
マルチノード構成にセカンダリノードがない状態のときにプライマリノードでノード障害が発生した場合,切り替え先のノードがないため,マルチノード構成のHADBサーバは異常終了します。このとき,ノード障害が発生したプライマリノードでHAモニタのmonshowコマンドを実行し,自系のサーバの状態を確認してください。
自系のサーバの状態がONL(実行処理中)の場合は,HAモニタのmonendコマンドを実行し,HAモニタを終了してください。
- メモ
-
ワーカーノードは,プライマリノードの切り替え先になりません。そのため,プライマリノードとワーカーノードだけの状態(セカンダリノードがない状態)のときに,プライマリノードでノード障害が発生した場合,ワーカーノードを含めたマルチノード構成のHADBサーバが異常終了します。