16.16.10 ハードウェアに関するトラブル(マルチノード機能の使用時)
ハードウェアに関するトラブルが発生したときの対処方法を説明します。
(1) ディスク障害が発生したときの対処方法
ディスク障害が発生したときの対処方法については,「15.4 ディスクに関するトラブル」を参照してください。
(2) ディスクが満杯になったときの対処方法
(a) DBエリアファイルが原因の場合
DBエリアファイルの容量増加によってディスクが満杯になった場合は,次の個所を参照して対処してください。
(b) DBエリアファイル以外が原因の場合
-
システムログファイルまたはステータスファイルが原因の場合
「15.3.3 DBエリアファイル以外のファイルの容量増加が原因の場合」の「(1) DBディレクトリ下の実体ファイルが原因の場合」を参照して対処してください。
-
システムログファイルまたはステータスファイル以外のファイルが原因の場合
「15.3.3 DBエリアファイル以外のファイルの容量増加が原因の場合」の「(2) シンボリックリンクしているファイルが原因の場合」を参照して対処してください。
(3) 通信障害,CPU障害,または電源障害が発生したときの対処方法
通信障害,CPU障害,または電源障害が発生したときの対処方法について説明します。
(a) HADBクライアントとプライマリノードのHADBサーバ間で通信障害が発生した場合
この場合,該当するトランザクションが,通信障害が発生した旨のエラーリターンします。対処手順を次に示します。
手順
-
通信障害が発生したプライマリノードをマルチノード構成から切り離す
コマンドを実行してプライマリノードを切り替えてください。通信障害が発生したプライマリノードは,マルチノード構成から切り離されます。コマンドによるプライマリノードの切り替え方法については,「16.7 コマンドによるプライマリノードの切り替え」を参照してください。
-
通信障害の原因を調査して対策する
-
手順1.で切り離したノードをマルチノード構成に復帰させる
マルチノード構成に復帰させる方法については,「16.15.3 マルチノード構成へのノードの復帰」を参照してください。
(b) HADBクライアントとセカンダリノードのHADBサーバ間で通信障害が発生した場合
この場合,該当するトランザクションが,通信障害が発生した旨のエラーリターンします。
通信障害の原因を調査してください。すぐに対処できない場合は,障害が発生したセカンダリノードのHADBサーバを終了してください。
(c) ノード間で通信障害が発生した場合
ノード間で通信障害が発生した場合の対処方法を説明します。系のリセットを使用している場合と,共有ディスクのSCSIリザーブを使用している場合とで対処方法が異なります。
-
系のリセットを使用している場合
ノード間で通信障害が発生した場合,HAモニタはノード障害が発生したと判断します。このとき,マルチノード構成から切り離されるノードをHAモニタが決定します。切り離されるノードにプライマリノードが含まれている場合,プライマリノードの切り替えが発生します。
なお,マルチノード構成から切り離されたノードのサーバマシンは,HAモニタによって停止されます(サーバマシンの電源断となります)。サーバマシンが停止しなかった場合は,HAモニタのmonswapコマンドを実行したあとに,サーバマシンを手動で停止してください。
そのあと,サーバマシンを再起動し,通信障害の原因を調査して対策してください。
対策後,必要に応じて,そのノードをマルチノード構成に復帰させてください。マルチノード構成に復帰させる方法については,「16.15.3 マルチノード構成へのノードの復帰」を参照してください。
-
共有ディスクのSCSIリザーブを使用している場合
ノード間で通信障害が発生した場合,HAモニタはノード障害が発生したと判断します。このとき,マルチノード構成から切り離されるノードをHAモニタが決定します。切り離されるノードにプライマリノードが含まれている場合,プライマリノードの切り替えが発生します。なお,マルチノード構成から切り離されたノードのサーバマシンは,停止しません。
この場合,通信障害の原因を調査して対策してください。対策後,必要に応じて,そのノードをマルチノード構成に復帰させてください。マルチノード構成に復帰させる方法については,「16.15.3 マルチノード構成へのノードの復帰」を参照してください。
なお,HAモニタの監視パスに障害が発生した場合,HAモニタのmonlinkコマンドを実行して,監視パスを復旧する必要があります。対処方法の詳細については,マニュアルHAモニタ Linux(R)(x86)編の障害発生による系切り替え時の運用を参照してください。
(d) CPU障害が発生した場合
セカンダリノードでCPU障害が発生した場合,そのセカンダリノードはマルチノード構成から切り離されます。
プライマリノードでCPU障害が発生した場合,プライマリノードの切り替えが発生します。CPU障害が発生したプライマリノードは,マルチノード構成から切り離されます。
OSのリブート後,原因を調査して対策してください。対策後,切り離されたノードをマルチノード構成に復帰させてください。マルチノード構成に復帰させる方法については,「16.15.3 マルチノード構成へのノードの復帰」を参照してください。
(e) 電源障害が発生した場合
セカンダリノードで電源障害が発生した場合,そのセカンダリノードはマルチノード構成から切り離されます。
プライマリノードで電源障害が発生した場合,プライマリノードの切り替えが発生します。電源障害が発生したプライマリノードは,マルチノード構成から切り離されます。
OSのリブート後,原因を調査して対策してください。対策後,切り離されたノードをマルチノード構成に復帰させてください。マルチノード構成に復帰させる方法については,「16.15.3 マルチノード構成へのノードの復帰」を参照してください。