Hitachi

高信頼化システム監視機能 HAモニタ AIX(R)編


7.1.2 運用中の留意事項

HAモニタの運用中は,系切り替え可能状態かどうかを常に監視してください。

また,あらかじめ,エラーメッセージが出力された場合の対処を検討しておいてください。特に,「7.5 障害への対処」で説明している障害については,具体的な対処方法を決定し,障害発生時の手順としてまとめておいてください。

系切り替えができない状態,および系切り替え可能状態かどうかを監視する方法について説明します。

系切り替えができない状態
  • 実行サーバが起動完了しているが,系切り替えできる状態になっていない場合

  • 系の稼働数が最少稼働ホスト数以下である場合(サーバを起動していないHAモニタも含む)

  • リセットパスのヘルスチェックで異常を検知している場合

系切り替え可能状態かどうかを監視する方法
  • 系切り替えができないおそれがある場合は,エラー,または警告メッセージがsyslogに出力されます。次のメッセージが出力されていないか,syslogを監視してください。

    表7‒1 系切り替えができない場合に出力されるメッセージ

    系切り替えができない場合に出力されるメッセージID

    メッセージテキスト

    KAMN308-E

    ホスト:aa....aa の待機サーバ(bb....bb)が異常終了しました。

    KAMN399-E

    リセットパスに異常が発生しました。

    KAMN624-E

    ホスト:aa....aa の系切替機構が異常です。

    KAMN288-W

    実行サーバ:aa....aa は系切り替え可能状態ではありません。

    KAMN447-W

    稼働中の系の数が最少稼働ホスト数以下です。稼働中の系の数:aa....aa 最少稼働ホスト数:bb....bb

    KAMN644-W

    ホスト:aa....aa のリセットパスで異常が発生しています。詳細コード:bb....bb 障害リセットパス:cc....cc

  • function定義文の,notswitch_notifyオペランドでuseを指定してください。useを指定すると,系切り替えができない状態の場合,1時間おきに繰り返し警告メッセージが出力されます(KAMN288-WKAMN447-W,およびKAMN644-Wメッセージ)。

ここで示すメッセージがsyslogに出力されていた場合は,メッセージが出力された原因を調査し,速やかに系切り替え可能な状態に回復してください。