Hitachi

高信頼化システム監視機能 HAモニタ Linux(R)(x86)編


7.5.8 共有ディスクのデバイス障害に対処する(実行サーバ終了時)(共有ディスクのSCSIリザーブをする場合)

実行サーバ終了時に,サーバ対応の環境設定のscsi_deviceオペランド,またはdmmp_deviceオペランドに指定したデバイスでI/Oエラーが発生した場合は,メッセージKAMN725-W,およびKAMN726-Eを出力してOSを停止します。マルチパスソフトウェアによる冗長化構成の場合は,同じ共有ディスクのすべてのパスに障害が発生したときにだけ,メッセージKAMN726-Eが出力されます。同じ共有ディスクの一部のパスの障害では,OSを停止しないでサーバの終了処理を続行する。

実行サーバ終了後に復旧する場合の手順を次に示します。

  1. デバイス障害の原因を調査する。

    メッセージKAMN725-WKAMN726-E,およびカーネルが出力するメッセージを参照したり,ハードウェアの管理ツールを使用したりして,障害の原因を調査してください。

  2. デバイス障害の原因を取り除く。

    原因となった機器を交換するなどし,デバイス障害の原因を取り除いてください。

    マルチパスソフトウェアによる冗長化構成の場合は,この時点ではまだ障害となったパスをオンライン状態に回復(フェイルバック)しないでください。

  3. マルチパス構成の場合は,障害から復旧したパスをオンライン状態に回復(フェイルバック)する。

    マルチパスソフトウェア(HDLM,DMMP,またはHFC-PCM)のコマンドを使用して,復旧したパスをオンライン状態に回復(フェイルバック)します。パスをオンライン状態に回復する方法については,マニュアルHitachi Dynamic Link Manager Software ユーザーズガイド(Linux(R)用),DMMPまたはHFC-PCMのマニュアルを参照してください。

    シングルパス構成,またはVMware ESXiでの仮想化環境(DMMP未使用時)の場合はこの手順は不要です。

  4. リザーブを解除する。

    実行サーバの正常終了時に障害が発生した場合は,「7.5.12 共有ディスクのSCSIリザーブの解除手順」を参照してリザーブを解除してください。

    なお,実行サーバの計画終了時,または異常終了時に障害が発生した場合は,待機サーバが強制的にリザーブを確保するため,リザーブを解除する必要はありません。