Hitachi

高信頼化システム監視機能 HAモニタ AIX(R)編


7.5.7 共有ディスクのデバイス障害に対処する(実行サーバ起動時以外)(ハイブリッドフェンシングを使用する場合)

実行サーバ起動時以外(実行サーバ稼働中,実行サーバ終了時,待機サーバ起動時,待機サーバ待機時,待機サーバ終了時,および系切り替え時)に,サーバ対応の環境設定のscsi_deviceオペランドに指定したデバイスでI/Oエラーが発生した場合は,メッセージKAMN725-W,およびKAMN726-Eが出力されます。マルチパスソフトウェアによる冗長化構成の場合は,同じ共有ディスクのすべてのパスに障害が発生したときにだけ,メッセージKAMN726-Eが出力されます。

実行サーバ起動時以外(実行サーバ稼働中,実行サーバ終了時,待機サーバ起動時,待機サーバ待機時,待機サーバ終了時,系切り替え時)に復旧する場合の手順を次に示します。

なお,ホストバスアダプタ(HBA)の交換・追加,共有ディスク(LU)の追加の場合は,実行サーバを停止しないと復旧できません。

  1. デバイス障害の原因を調査する。

    メッセージKAMN725-WKAMN726-E,およびカーネルが出力するメッセージを参照したり,ハードウェアの管理ツールを使用したりして,障害の原因を調査してください。

  2. デバイス障害の原因を取り除く。

    原因となった機器を交換するなどし,デバイス障害の原因を取り除いてください。

    マルチパスソフトウェアによる冗長化構成の場合は,この時点ではまだ障害となったパスをオンライン状態に回復(フェイルバック)しないでください。

  3. マルチパス構成の場合は,障害から復旧したパスをオンライン状態に回復(フェイルバック)する。

    マルチパスソフトウェア(HDLM)のコマンドを使用して,復旧したパスをオンライン状態に回復(フェイルバック)します。パスをオンライン状態に回復する方法については,マニュアルHitachi Dynamic Link Manager Software ユーザーズガイド(AIX(R)用)を参照してください。

    シングルパス構成の場合はこの手順は不要です。

なお,系切り替えをする場合に,errlogファイルに「ラベル:HSDRV_RSV_CONFLICT 説明:ディスク操作エラー 考えられる原因:リザベーションコンフリクト」というメッセージが出力されることがあります。

これは,稼働中のサーバがディスクの保護のためにSCSIリザーブをしており,正常な動作であるため対策は不要です。