Hitachi

高信頼化システム監視機能 HAモニタ AIX(R)編


7.4.1 待ち状態のサーバを起動して業務を再開する

HAモニタは,他系のHAモニタと連絡を取り合っています。実行系と待機系とで,サーバの状態を監視し,他系のサーバの状態に合わせて,自系のサーバの状態を決定します。そのため,起動したサーバが,起動完了しないで待ち状態になることがあります。ここでは,待ち状態になったサーバを,起動したり停止したりする方法について説明します。

サーバの待ち状態には複数の種類があり,それぞれ起動方法および停止方法が異なります。サーバが待ち状態になった場合,待ち状態であることを通知するメッセージが一定間隔で出力されます。サーバの待ち状態の種類と操作方法を次の表に示します。

表7‒4 サーバの待ち状態の種類と操作方法

種類

monshowコマンドでの表示

説明

メッセージ

起動・停止方法

再起動待ち状態

*ONL*

実行サーバに障害が発生したあと,実行サーバを再起動させることができます。障害が発生してから再起動が完了するまでの間を,再起動待ち状態と呼びます。

KAMN258-D

起動:プログラムが提供する起動コマンド

停止:mondeact

系切り替え待ち状態

ONL??

系切り替えが発生すると,HAモニタは,待機系の待機サーバを実行サーバに切り替えます。実行サーバに切り替える際,HAモニタは,実行系(障害が発生した系)の実行サーバが停止したかどうかを確認します。

停止を確認できた場合,待機系の待機サーバは実際に実行サーバとして起動されます。

停止を確認できなかった場合,待機系の待機サーバは実行サーバとして実際に起動する前に,いったん待ち状態になります。この待機系の実行サーバが,実行サーバとして実際に起動するのを待っている状態を,系切り替え待ち状態と呼びます。

ハイブリッドフェンシングで系のリセットに失敗したあと,共有ディスクのSCSIリザーブの確保に失敗した場合にも,系切り替え待ち状態になります。

KAMN368-D

起動:monact

停止:mondeact

実行サーバの起動待ち状態

*SBY*

監視パスの障害などの理由で,実行サーバの状態が確認できない場合,待機サーバは,実行サーバが起動するのを待ちます。実行サーバの起動を待っている状態を,実行サーバの起動待ち状態と呼びます。

KAMN238-D

起動:monact

停止:mondeact

リソースサーバの起動待ち状態

リソースサーバが起動を完了していない場合,子サーバはリソースサーバの起動を待ちます。リソースサーバの起動を待っている状態を,リソースサーバの起動待ち状態と呼びます。

なし

起動:リソースサーバの起動後に,monact

停止:リソースサーバの停止後,または起動後に,mondeact

連動系切り替え待ち状態

SBY??

複数のサーバをグループ化している場合,あるサーバに,障害が発生しても連動系切り替えをしない設定ができます。連動系切り替えをしない設定にしているサーバに障害が発生した場合,対応する待機サーバは連動系切り替え待ち状態になります。

なお,そのホスト以外で実行サーバまたは待機サーバが起動した場合は,系切り替え可能状態に戻ります。

なし

起動:monact

停止:monsbystp

起動リトライ中

>ONL

系切り替え時,切り替え先の系でリソースの接続やサーバの起動に失敗し,ほかに切り替えできる系がない場合,系切り替え時に起動リトライする機能を使用していると,HAモニタはサーバに再起動指示を出します。系切り替え失敗時からサーバ起動処理開始までの状態のことを起動リトライ中と呼びます。

KAMN296-I

起動:プログラムが提供する起動コマンド

停止:mondeact

表中の「起動・停止方法」に記載されているのは,HAモニタのコマンド名です。また,表中の「monshowコマンドでの表示」は,サーバ・系の状態表示コマンド(monshowコマンド)を実行したときに表示されるサーバの状態を示しています。HAモニタのコマンドの詳細については,「9. コマンド」を参照してください。サーバの状態遷移については,「4.1.3 サーバの状態遷移」を参照してください。