JP1/Base 運用ガイド

[目次][用語][索引][前へ][次へ]


10.4.4 クラスタソフトへの登録

使用するクラスタソフトに,フェールオーバーさせるJP1/Baseのデーモンを登録してください。クラスタソフトに登録する機能と,各機能で使用するコマンドを次の表に示します。

登録する機能 説明 使用するコマンド
起動 JP1/Baseを起動します。 jbs_start.cluster 論理ホスト名
停止 JP1/Baseを停止します。 jbs_stop.cluster 論理ホスト名
動作監視 JP1/Baseが正常に動作していることを監視します。または,その時点で正常に動作しているかどうかを確認します。なお,この機能を提供していないクラスタソフトもあります。JP1/Baseの障害時にフェールオーバーする必要がない場合,この機能は登録しません。 jbs_spmd_status -h 論理ホスト名
jevstat 論理ホスト名
強制停止 JP1/Baseを強制的に停止し,使用中のリソースを解放します。 jbs_killall.cluster 論理ホスト名

これらのコマンドは,下記のディレクトリに格納されています。

/etc/opt/jp1base/

起動する場合は,「jbs_start.cluster 論理ホスト名」コマンドを実行します。なお,このjbs_start.clusterコマンド内では,次に示すコマンドを実行しています。

また,停止する場合は,「jbs_stop.cluster 論理ホスト名」コマンドを実行します。なお,このjbs_stop.clusterコマンド内では,次に示すコマンドを実行しています。

注意事項
「jevstart 論理ホスト名」および「jevstop 論理ホスト名」の「論理ホスト名」は,このマニュアルのイベントサービスに関する記述の「イベントサーバ名」に対応しています。

登録方法の詳細は各クラスタソフトのマニュアルを参照してください。また,指定の際は,次の点に注意してください。

JP1/Baseをクラスタソフトへ登録する場合,次のように設定してください。

登録する機能 説明 使用するコマンド
起動 JP1/Baseを起動します。
  • 起動コマンドの終了タイミング
    起動コマンドは,JP1/Baseが起動するのを待って終了します。ただし,何らかの問題によって,タイムアウト時間(標準60秒)を過ぎても起動処理が完了しない場合は,起動処理の途中でコマンドが終了します。この場合,起動処理は中断せず,起動処理を続けている状態のままコマンドが終了します。
  • 起動コマンドの結果判定
    JP1/Baseを起動した結果は,後述する動作監視の方法によって判定してください。通常は,クラスタソフトの動作監視によって判定します。なお,起動コマンドの戻り値は,0(正常終了)と1(引数異常)のため,戻り値での結果判定はできません。
jbs_start.cluster 論理ホスト名
停止 JP1/Baseを停止します。
  • 停止コマンドの終了タイミング
    停止コマンドは,JP1/Baseが停止するのを待って終了します。ただし,何らかの問題によって,タイムアウト時間(標準60秒)を過ぎても停止処理が完了しない場合は,停止処理の途中でコマンドが終了します。この場合,停止処理は中断せず,停止処理を続けている状態のままコマンドが終了します。
  • 停止コマンドの結果判定
    JP1/Baseを停止した結果は,後述する動作監視の方法によって判定してください。なお,停止コマンドの戻り値は,0(正常終了)と1(引数異常)のため,戻り値での結果判定はできません。

〈備考〉
停止コマンドが終了したあと,念のため,後述する強制停止コマンドを実行することを推奨します。これは,何らかの問題がある場合でも確実にプロセスを終了させ,フェールオーバーが失敗することを防ぐためです。
jbs_stop.cluster 論理ホスト名
動作監視 JP1/Baseが正常に動作していることを,jbs_spmd_statusコマンドおよびjevstatコマンドの戻り値によって監視します。なお,これらのコマンドでは,各プロセスが動作しているか,動作していないかで動作状態を判定しています。
この機能を提供していないクラスタソフトもあります。JP1/Baseの障害時にフェールオーバーする必要がない場合,この機能は登録しません。
  • 動作監視の結果判定
    各戻り値の判定方法を次に示します。
    戻り値=0 (すべて動作)
    JP1/Baseは正常に動作しています。
    戻り値=1 (エラー)
    回復不能なエラーが発生しました。異常と判定してください。
    〈注意〉
    共有ディスクがオフラインの待機系でjbs_spmd_statusコマンドを実行すると,共有ディスクがないため戻り値が1になります。
    戻り値=4 (一部停止)
    JP1/Baseの一部のプロセスが,何らかの問題によって停止しています。異常と判定してください(UNIXの場合)。
    戻り値=8 (すべて停止)
    JP1/Baseのプロセスが何らかの問題によって停止しています。異常と判定してください。
    戻り値=12 (リトライ可能エラー)
    jbs_spmd_statusコマンドによる動作状態の確認中に,リトライによって復旧可能なエラーが発生しました。一定回数を限度に,動作状態の確認をリトライしてください。なお,この戻り値は,jevstatコマンドではリトライ不可エラーとなります。
jbs_spmd_status -h論理ホスト名
jevstat 論理ホスト名
強制停止 JP1/Baseを強制的に停止し,使用中のリソースを解放します。
jbs_killall.clusterコマンドを実行すると,JP1/Baseの終了処理を一切行わずに,各プロセスを強制的に停止します。

〈注意〉
強制停止をする前に,停止コマンドによってJP1/Baseを停止してください。強制停止のコマンドは,停止コマンドを実行しても処理が終了しないなど,問題が発生した場合に限り実行してください。
jbs_killall.cluster 論理ホスト名

※ Windowsの場合の動作を次に示します。
Windowsの場合は,Windowsのサービス制御との関連によって,UNIXの場合とは動作が異なります。Windowsでは,プロセスの一部が停止すると,JP1のプロセス管理が自動的にすべての各プロセスを停止して,サービスを停止状態にします。サービスの停止によって異常と判定するか,jbs_spmd_statusコマンドの戻り値が8になるのを待ってから異常と判定してください。

〈備考〉JP1の再起動について
クラスタ運用のJP1の障害を検知した場合に,待機系サーバにフェールオーバーする前に,同じサーバでJP1を再起動して回復を試みる場合があります。
この場合は,JP1のプロセス管理による再起動ではなく,クラスタソフトの制御による再起動を推奨します。
クラスタソフトはJP1の障害検知後に再起動を試みるため,障害の内容によってはJP1の再起動機能が影響を受け,正常に動作できないおそれがあります。より確実に再起動を行うために,クラスタソフトからの制御でJP1を再起動してください。

[目次][前へ][次へ]


[他社商品名称に関する表示]

All Rights Reserved. Copyright (C) 2006, 2008, Hitachi, Ltd.