15.2.12 エージェントの障害回復待ち時間を短縮する設定方法
JP1/AJS3では,ジョブ(キューレスジョブを除くPCジョブ,UNIXジョブ,フレキシブルジョブ※,HTTP接続ジョブ,JP1/AJS3上で実行するQUEUEジョブ,アクションジョブ,およびカスタムジョブ)の実行ホスト(エージェントホスト)が障害状態になった場合や通信障害が発生した場合,即時に異常検知とはしないで,ある程度の待ち時間を設けて通信リトライすることで,エージェントホスト上のシステム障害や通信障害状態が回復するのを待ちます。これによって,一時的な障害による,回復可能な業務停止を防止しています。通常,障害回復待ち時間はデフォルトで10分です。ただし,運用によっては障害が発生した場合は回復を待つことよりも,直ちに異常を検知して早急なリカバリーを優先させる場合があります。その場合は障害回復待ち時間を短縮することで,早急な障害検知ができます。
- 注※
-
フレキシブルジョブの場合,エージェントホストを中継エージェントに読み替えてください。
エージェントホストの障害回復待ち時間を短縮する設定方法について次に説明します。
- 〈この項の構成〉
(1) 定義手順
-
JP1/AJS3のサービスを停止する。
次のコマンドを実行して,プロセスがすべて停止していることを確認します。
# /etc/opt/jp1ajs2/jajs_stop※ # /opt/jp1ajs2/bin/jajs_spmd_status
- 注※
-
自動停止の設定がされていることを確認してください。
クラスタ運用をしている場合は,論理ホストのJP1/AJS3のサービスも停止してください。
-
次のコマンドを実行して,「(2) 環境設定パラメーター一覧」の環境設定パラメーターを設定する。
jajs_config -k "定義キー名" "環境設定パラメーター名1"=定義内容1 ["環境設定パラメーター名2"=定義内容2]
- 注意事項
-
クラスタ運用をしている場合は,実行系・待機系の両方でこの設定をしてください。
-
JP1/AJS3を再起動する。
設定した内容が反映されます。
(2) 環境設定パラメーター一覧
定義キー |
環境設定パラメーター |
定義内容 |
---|---|---|
|
"QueuingJobRecoveryTime"= |
キューイング中のジョブに対するエージェントの障害回復待ち時間(単位:秒) |
"ExecutingJobRecoveryTime"= |
実行中のジョブに対するエージェントの障害回復待ち時間(単位:秒) |
- 注※
-
{JP1_DEFAULT|論理ホスト名}の部分は,物理ホストの場合は「JP1_DEFAULT」を,論理ホストの場合は「論理ホスト名」を指定します。
環境設定パラメーターの定義内容の詳細については,次の個所を参照してください。