Hitachi

高信頼化システム監視機能 HAモニタ Linux(R)(x86)編


6.24.4 系切り替えのテスト

HAモニタの動作確認およびサーバの動作確認が完了したら,系切り替えのテストをします。系切り替えのテストは,HAモニタおよびサーバを起動してから実施してください。

〈この項の構成〉

(1) 計画系切り替えの確認

サーバの系切り替えコマンド(monswapコマンド)を実行して,計画系切り替えのテストを実行してください。計画系切り替えを実行したら,サーバ・系の状態表示コマンド(monshowコマンド)を実行してください。

系1から系2に計画系切り替えのテストを実行した場合でテストに成功したときの,サーバ・系の状態表示コマンド(monshowコマンド)の実行結果の例を次に示します。切り替え先のサーバの状態が"ONL"ならば,計画系切り替えに成功したことを示しています。

#/opt/hitachi/HAmon/bin/monshow
KAMN213-I Own host name : host2
    Own servers               Pair servers
    Alias     Status          Status     Host name
    server2   ONL

マルチスタンバイ機能を使用する場合は,すべての予備系でサーバの起動が完了することを確認してください。

(2) サーバ障害時の自動系切り替えの確認

ユーザがサーバ障害を発生させ,HAモニタが自動系切り替えを実行するかどうかを確認してください。障害が回復したら,サーバ・系の状態表示コマンド(monshowコマンド)を実行してください。

系1から系2への自動系切り替えが成功したときの,サーバ・系の状態表示コマンド(monshowコマンド)の実行結果の例を示します。切り替え先のサーバの状態が"ONL"ならば,自動系切り替えに成功したことを示しています。

#/opt/hitachi/HAmon/bin/monshow
KAMN213-I Own host name : host2
    Own servers               Pair servers
    Alias     Status          Status     Host name
    server2   ONL

(3) プログラム障害時の自動系切り替えの確認

サーバがモニタモードで,かつプログラム管理機能を使用している場合は,ユーザがプログラム障害を発生させ,HAモニタが自動系切り替えを実行するかどうかを確認してください。障害が回復したら,サーバ・系の状態表示コマンド(monshowコマンド)に-uオプションを指定して実行してください。

プログラム障害時の自動系切り替えが成功したときの,サーバ・系の状態表示コマンド(monshowコマンド)の実行結果の例を次に示します。プログラムの状態が"ACT"ならば,自動系切り替えに成功したことを示しています。

#/opt/hitachi/HAmon/bin/monshow -u
KAMN213-I Own host name : host2
     Alias     Program Alias  Status   Patrol time
     server2   UAP1            ACT        3600

(4) 系障害時の自動系切り替えの確認

ユーザが系障害を発生させ,HAモニタが自動系切り替えを実行するかどうかを確認してください。リセットパスの設定で,VMware ESXiで仮想化する設定をした場合は,リセットパスが正しく設定されているかを確認するため,自系に系障害を発生させて仮想マシンがリセットされることを確認してください。

障害が回復したら,サーバ・系の状態表示コマンド(monshowコマンド)を実行してください。

対象となる系を強制停止させることで,系障害を発生させることができます。

系1から系2への自動系切り替えが成功したときの,サーバ・系の状態表示コマンド(monshowコマンド)の実行結果の例を示します。切り替え先のサーバの状態が"ONL"ならば,自動系切り替えに成功したことを示しています。

#/opt/hitachi/HAmon/bin/monshow
KAMN213-I Own host name : host2
    Own servers               Pair servers
    Alias     Status          Status     Host name
    server2   ONL

共有ディスク上にファイルシステムを構築していると,サーバ起動時に実施するファイルシステムの整合性チェック処理に時間が掛かる場合があります。ファイルシステムを使用するサーバのサーバ対応の環境設定の共有リソース切り替えタイムアウト値(dev_timelimitdev_offlimit,またはdev_onlimit)を設定する場合は,系障害時の系切り替えを実施し,タイムアウトしないことを確認してください。

系障害の系切り替えを実施したあとに,OSのダンプファイル出力が設定ミスや容量不足で失敗していないことを確認してください。ダンプファイル出力が成功していることを確認する方法は,Linux Tough Dumpのマニュアルを参照してください。

共有ディスクのデータ保護法式として系をリセットする場合は,リセットパスの設定に誤りがあると,無関係な系をリセットしてしまう場合があります。リセットパスの設定の正しさを確認するために,それぞれの系で系障害を発生させ,正しく系切り替えできることを確認してください。日立サーバ論理分割機構(Virtage)やVMware ESXiで仮想化環境での物理パーティションリセット機能を使用する場合は,ゲストOSの障害による系切り替えだけではなく,ホストOSやハードウェア障害による系障害の系切り替えも確認してください。

共有ディスクのSCSIリザーブを使用する場合,系切り替え後の実行系ですべての共有ディスクのリザーブが確保できていることを確認してください。共有ディスクのリザーブ状態の確認方法は,「7.5.7 共有ディスクのデバイス障害に対処する(実行サーバ稼働中)(共有ディスクのSCSIリザーブをする場合)」の4. ディスクのリザーブ状態を確認するを参照してください。