JP1/Integrated Management - Event Gateway for Network Node Manager i

[目次][用語][索引][前へ][次へ]


3.3.2 クラスタソフトへの登録(UNIXの場合)

UNIX環境で,論理ホストのJP1/IM - EG for NNMiおよびJP1/Baseをクラスタソフトに登録する方法について説明します。

<この項の構成>
(1) クラスタソフトに登録するスクリプトの作成
(2) リソースの起動停止順序の設定

(1) クラスタソフトに登録するスクリプトの作成

UNIXのクラスタソフトでは,通常,スクリプトなどによってアプリケーションを制御するツールを作成して,クラスタソフトに登録します。このときのスクリプトには一般的に,「起動」「停止」「動作監視」「強制停止」の機能が必要です。

ここでは,スクリプト設計に必要なJP1/IM - EG for NNMiの情報を説明します。この情報を基に,クラスタソフトの仕様に合わせて,JP1/IM - EG for NNMiを制御するスクリプトを作成し,クラスタソフトに登録してください。

表3-3 クラスタ登録でのスクリプト設計のための詳細情報

登録する機能 説明
起動 JP1/IM - EG for NNMiを起動します。
  • 使用するコマンド
    「jegn_start.cluster 論理ホスト名
  • コマンドの終了タイミング
    起動コマンドは,JP1/IM - EG for NNMiが起動するのを待って終了します。ただし,何らかの問題によって,タイムアウト時間(標準60秒)を過ぎても起動処理が完了しない場合は,起動処理の途中でコマンドが終了します。この場合,起動処理は中断されないで,起動処理を続けている状態のままコマンドが終了します。
  • コマンドの結果判定
    JP1/IM - EG for NNMiを起動した結果は,後述する動作監視の方法によって判定してください。通常は,クラスタソフトの動作監視によって判定します。なお,起動コマンドの戻り値は,0(正常終了)と1(引数異常)のため,戻り値での結果判定はできません。
停止 JP1/IM - EG for NNMiを停止します。
  • 使用するコマンド
    「jegn_stop.cluster 論理ホスト名
  • コマンドの終了タイミング
    停止コマンドは,JP1/IM - EG for NNMiが停止するのを待って終了します。ただし,何らかの問題によって,タイムアウト時間(標準60秒)を過ぎても停止処理が完了しない場合は,停止処理の途中でコマンドが終了します。この場合,停止処理は中断されないで,停止処理を続けている状態のままコマンドが終了します。
  • コマンドの結果判定
    JP1/IM - EG for NNMiを停止した結果は,後述する動作監視の方法によって判定してください。なお,停止コマンドの戻り値は,0(正常終了)と1(引数異常)のため,戻り値での結果判定はできません。
なお,停止コマンドが終了したあと,後述する強制停止コマンドを実行することをお勧めします。これは,何らかの問題がある場合でも確実にプロセスを終了させ,フェールオーバーが失敗することを防ぐためです。
動作監視 JP1/IM - EG for NNMiが正常に動作していることを監視します。
正常に動作していることは,jegn_spmd_statusコマンドの戻り値によって判定します。このコマンドでは,各プロセスが動作しているか,動作していないかで動作状態を判定しています。
なお,動作監視の機能を提供していないクラスタソフトもあります。また,JP1/IM - EG for NNMiのトラブル時にフェールオーバーする必要がない場合,この機能は登録しません。
  • 使用するコマンド
    「jegn_spmd_status -h 論理ホスト名
  • 動作監視の結果判定
    各戻り値の判定方法を次に示します。
    戻り値=0(すべて動作)
    JP1/IM - EG for NNMiは正常に動作しています。
    戻り値=1(エラー)
    回復不能なエラーが発生しました。異常と判定してください。
    注意
    共有ディスクがオフラインの待機系サーバでjegn_spmd_statusコマンドを実行すると,共有ディスクがないため戻り値が1になります。
    戻り値=4(一部停止)
    JP1/IM - EG for NNMiの一部のプロセスが,何らかの問題によって停止しています。異常と判定してください。
    戻り値=8(すべて停止)
    JP1/IM - EG for NNMiのプロセスが何らかの問題によって停止しています。異常と判定してください。
    戻り値=12(リトライ可能エラー)
    jegn_spmd_statusコマンドによる動作状態の確認中に,リトライによって復旧可能なエラーが発生しました。一定回数を限度に,動作状態の確認をリトライしてください。
強制停止 JP1/IM - EG for NNMiを強制的に停止し,使用中のリソースを解放します。
  • 使用するコマンド
    「jegn_killall.cluster 論理ホスト名
    jegn_killall.clusterコマンドを実行すると,JP1/IM - EG for NNMiの終了処理を一切行わずに,各プロセスを強制的に停止します。

注意
強制停止をする前に,停止コマンドによってJP1/IM - EG for NNMiを停止してください。

注※
WindowsとUNIXの場合,使用するコマンドは同じですが,動作確認に関するJP1の動作は異なりますので注意してください。
Windowsの場合は,Windowsのサービス制御との関連によって,UNIXの場合とは動作が異なります。Windowsでは,プロセスの一部が停止すると,JP1のプロセス管理が自動的にすべての各プロセスを停止して,サービスを停止状態にします。サービスの停止によって異常と判定するか,jegn_spmd_statusコマンドの戻り値が8になるのを待ってから異常と判定してください。

JP1の再起動について
クラスタ運用のJP1の障害を検知した場合に,待機系サーバにフェールオーバーする前に,同じサーバでJP1を再起動して回復を試みることがあります。この場合は,JP1のプロセス管理による再起動を使用しないでください。
クラスタソフトはJP1の障害検知後に再起動を試みるため,障害の内容によってはJP1の再起動機能が影響を受け,正常に動作できないおそれがあります。より確実に再起動を行うために,クラスタソフトからの制御でJP1を再起動してください。

(2) リソースの起動停止順序の設定

論理ホストのJP1/IM - EG for NNMiおよびJP1/Baseを実行するには,共有ディスクおよび論理IPアドレスを使用できる状態にする必要があります。

クラスタソフトの制御によって,次に示す動作をするように起動停止の順序または依存関係を設定してください。

[目次][前へ][次へ]


[他社商品名称に関する表示]

All Rights Reserved. Copyright (C) 2009, 2014, Hitachi, Ltd.