Hitachi

Hitachi Advanced Data Binder システム構築・運用ガイド


18.19.10 ハードウェアに関するトラブル(マルチノード機能の使用時)

ハードウェアに関するトラブルが発生したときの対処方法を説明します。

〈この項の構成〉

(1) ディスク障害が発生したときの対処方法

ディスク障害が発生したときの対処方法については,「16.4 ディスクに関するトラブル」を参照してください。

(2) ディスクが満杯になったときの対処方法

(a) DBエリアファイルが原因の場合

DBエリアファイルの容量増加によってディスクが満杯になった場合は,次の個所を参照して対処してください。

(b) DBエリアファイル以外が原因の場合

(3) 通信障害,CPU障害,または電源障害が発生したときの対処方法

通信障害,CPU障害,または電源障害が発生したときの対処方法について説明します。

(a) HADBクライアントとプライマリノードのHADBサーバ間で通信障害が発生した場合

この場合,該当するトランザクションが,通信障害が発生した旨のエラーリターンします。対処手順を次に示します。

手順(HAモニタありのマルチノード構成の場合)
  1. 通信障害が発生したプライマリノードをマルチノード構成から切り離す

    コマンドを実行してプライマリノードを切り替えてください。通信障害が発生したプライマリノードは,マルチノード構成から切り離されます。コマンドによるプライマリノードの切り替え方法については,「18.8 コマンドによるプライマリノードの切り替え」を参照してください。

  2. 通信障害の原因を調査して対策する

  3. 手順1.で切り離したノードをマルチノード構成に復帰させる

    マルチノード構成に復帰させる方法については,「18.16.3 マルチノード構成へのノードの復帰」を参照してください。

手順(HAモニタなしのマルチノード構成の場合)
  1. マルチノード構成のHADBサーバを終了する

    プライマリノードでadbstopコマンドを実行すると,全ノードのHADBサーバが正常終了します。

  2. 通信障害の原因を調査して対策する

  3. マルチノード構成のHADBサーバを開始する

    プライマリノードでadbstartコマンドを実行します。

  4. マルチノード構成にワーカーノードを追加する

    ワーカーノードでadbstartコマンドを実行します。

(b) HADBクライアントとセカンダリノードまたはワーカーノードのHADBサーバ間で通信障害が発生した場合

この場合,該当するトランザクションが,通信障害が発生した旨のエラーリターンします。

通信障害の原因を調査してください。すぐに対処できない場合は,障害が発生したセカンダリノードまたはワーカーノードのHADBサーバを終了してください。

(c) ノード間で通信障害が発生した場合

ノード間で通信障害が発生した場合の対処方法を説明します。

HAモニタありのマルチノード構成の場合
  • ライマリノードまたはセカンダリノードで通信障害が発生した場合

    系のリセットを使用している場合,共有ディスクのSCSIリザーブを使用している場合,またはクラウド環境のマルチノード構成の場合で対処方法が異なります。

    • 系のリセットを使用している場合

      ノード間で通信障害が発生した場合,HAモニタはノード障害が発生したと判断します。このとき,マルチノード構成から切り離されるノードをHAモニタが決定します。切り離されるノードにプライマリノードが含まれている場合,プライマリノードの切り替えが発生します。

      なお,マルチノード構成から切り離されたノードのサーバマシンは,HAモニタによって停止されます(サーバマシンの電源断となります)。サーバマシンが停止しなかった場合は,HAモニタのmonswapコマンドを実行したあとに,サーバマシンを手動で停止してください。

      そのあと,サーバマシンを再起動し,通信障害の原因を調査して対策してください。

      対策後,必要に応じて,そのノードをマルチノード構成に復帰させてください。マルチノード構成に復帰させる方法については,「18.16.3 マルチノード構成へのノードの復帰」を参照してください。

    • 共有ディスクのSCSIリザーブを使用している場合

      ノード間で通信障害が発生した場合,HAモニタはノード障害が発生したと判断します。このとき,マルチノード構成から切り離されるノードをHAモニタが決定します。切り離されるノードにプライマリノードが含まれている場合,プライマリノードの切り替えが発生します。なお,マルチノード構成から切り離されたノードのサーバマシンは,停止しません。

      この場合,通信障害の原因を調査して対策してください。対策後,必要に応じて,そのノードをマルチノード構成に復帰させてください。マルチノード構成に復帰させる方法については,「18.16.3 マルチノード構成へのノードの復帰」を参照してください。

      なお,HAモニタの監視パスに障害が発生した場合,HAモニタのmonlinkコマンドを実行して,監視パスを復旧する必要があります。対処方法の詳細については,マニュアルHAモニタ Linux(R)(x86)編障害発生による系切り替え時の運用を参照してください。

    • クラウド環境のマルチノード構成の場合

      ノード間で通信障害が発生した場合,HAモニタは系障害が発生したと判断します。このとき,マルチノード構成から切り離されるノードをHAモニタが決定します。切り離されるノードにプライマリノードが含まれている場合,プライマリノードの切り替えが発生します。

      なお,通信障害が発生したノードのインスタンスは,HAモニタによって強制停止されます。インスタンスが停止しない場合は,HAモニタのmonswapコマンドを実行したあとに,インスタンスを手動で停止してください。

      そのあと,インスタンスを再起動し,通信障害の原因を調査して対策してください。

      対策後,必要に応じて,そのノードをマルチノード構成に復帰させてください。マルチノード構成に復帰させる方法については,「18.16.3 マルチノード構成へのノードの復帰」を参照してください。

      メモ

      Azure環境の場合は,インスタンスを仮想マシンと読み替えてください。

  • ーカーノードで通信障害が発生した場合

    ワーカーノードとほかのノードの間で通信障害が発生した場合,マルチノード構成からそのワーカーノードが削除されます。

    通信障害の原因を調査して対策したあとに,ワーカーノードでadbstartコマンドを実行し,ワーカーノードをマルチノード構成に追加してください。

HAモニタなしのマルチノード構成の場合

プライマリノードとワーカーノードの間で通信障害が発生した場合,マルチノード構成からそのワーカーノードが削除されます。

通信障害の原因を調査して対策したあとに,ワーカーノードでadbstartコマンドを実行し,ワーカーノードをマルチノード構成に追加してください。

(d) CPU障害が発生した場合

■プライマリノードまたはセカンダリノードでCPU障害が発生した場合
  • HAモニタありのマルチノード構成の場合

    ライマリノードでCPU障害が発生した場合,プライマリノードの切り替えが発生します。CPU障害が発生したプライマリノードは,マルチノード構成から切り離されます。

    セカンダリノードでCPU障害が発生した場合,そのセカンダリノードはマルチノード構成から切り離されます。

    OSのリブート後,原因を調査して対策してください。対策後,切り離されたノードをマルチノード構成に復帰させてください。マルチノード構成に復帰させる方法については,「18.16.3 マルチノード構成へのノードの復帰」を参照してください。

  • HAモニタなしのマルチノード構成の場合

    プライマリノードでCPU障害が発生してプライマリノードのHADBサーバが異常終了した場合,マルチノード構成のHADBサーバが異常終了します。

    OSのリブート後,原因を調査して対策してください。対策後,マルチノード構成のHADBサーバを開始してください。

■ワーカーノードでCPU障害が発生した場合

ワーカーノードでCPU障害が発生した場合,そのワーカーノードはマルチノード構成から削除されます。

OSのリブート後,原因を調査して対策してください。対策後,ワーカーノードでadbstartコマンドを実行し,ワーカーノードをマルチノード構成に追加してください。

(e) 電源障害が発生した場合

■プライマリノードまたはセカンダリノードで電源障害が発生した場合
  • HAモニタありのマルチノード構成の場合

    ライマリノードで電源障害が発生した場合,プライマリノードの切り替えが発生します。電源障害が発生したプライマリノードは,マルチノード構成から切り離されます。

    セカンダリノードで電源障害が発生した場合,そのセカンダリノードはマルチノード構成から切り離されます。

    OSのリブート後,原因を調査して対策してください。対策後,切り離されたノードをマルチノード構成に復帰させてください。マルチノード構成に復帰させる方法については,「18.16.3 マルチノード構成へのノードの復帰」を参照してください。

  • HAモニタなしのマルチノード構成の場合

    プライマリノードで電源障害が発生してプライマリノードのHADBサーバが異常終了した場合,マルチノード構成のHADBサーバが異常終了します。

    OSのリブート後,原因を調査して対策してください。対策後,マルチノード構成のHADBサーバを開始してください。

■ワーカーノードで電源障害が発生した場合

ワーカーノードで電源障害が発生した場合,そのワーカーノードはマルチノード構成から削除されます。

OSのリブート後,原因を調査して対策してください。対策後,ワーカーノードでadbstartコマンドを実行し,ワーカーノードをマルチノード構成に追加してください。