Hitachi

Hitachi HA Toolkit


2.7.3 障害時のサーバ再起動

サーバの障害を検知した場合,HA Toolkit Exは系切り替えまたはサーバの再起動をします。ここでは,障害時のサーバ再起動について説明します。

サーバの再起動では,サーバの障害を検知すると,HA Toolkit Exは,サーバの障害が発生した系でサーバが自動で再起動するのを待ちます。サーバが再起動するまでの状態をサーバの再起動待ち状態と呼びます。HA Toolkit Exは,障害が発生した実行サーバを再起動待ち状態にして,サーバが自動で再起動するのを待ちます。サーバの再起動が失敗した場合は,サーバ自身が再起動を繰り返し試行します。

サーバで定義されているサーバの再起動試行回数を超えると,HA Toolkit Exは,環境設定での定義に従って次のどちらかを実行します。

障害時のサーバ再起動の流れを次に示します。

図2‒10 障害時のサーバ再起動の流れ(HA Toolkit Ex)

[図データ]

  1. 障害発生

    実行サーバで障害が発生します。

  2. 再起動を試行

    サーバが再起動を試行します。

  3. 再起動に失敗

    サーバが再起動に失敗した場合,定義されている再起動試行回数まで,サーバの再起動を繰り返します。

  4. サーバの停止

    再起動試行回数を超えた場合,HA Toolkit Exの監視プロセスがサーバを停止します。サーバを停止したあとの動作は,環境設定での定義によって異なります。

    系切り替えの場合

    HA Toolkit Exがクラスタソフトに障害通知をして,クラスタソフトが系切り替えをします。

    オペレーターの操作待ちの場合

    オペレーターが系切り替えをします。