15.2.19 通信障害時に実行中のジョブをすべて終了状態にする設定方法
JP1/AJS3では,実行中のジョブ(キューレスジョブを除くPCジョブ,UNIXジョブ,フレキシブルジョブ※,HTTP接続ジョブ,JP1/AJS3上で実行するQUEUEジョブ,アクションジョブ,およびカスタムジョブ)を5分間隔でポーリング監視します。
- 注※
-
フレキシブルジョブの場合,マネージャーホストと中継エージェント間でポーリング監視します。
ポーリング監視では,ジョブの実行先のエージェントホストで通信障害が発生した場合に,即時に異常検知とはしないで,障害回復待ち時間(デフォルト10分)の間は,通信リトライすることでエージェントホストのシステム障害や通信障害状態が回復するのを待ちます。これによって,一時的な障害による,回復可能な業務停止を防止しています。
ポーリング監視でエージェントホストの状態が回復しない場合,ジョブごとに障害回復待ち時間を待ってからジョブの状態を1件ずつ終了状態※にします。そのため,実行中のジョブが多い場合は,すべてのジョブが終了状態になるまでに時間が掛かる場合があります。ただし,運用によっては障害が発生した場合は回復を待つことよりも,直ちに異常を検知して早急なリカバリーを優先させる場合があります。その場合は,ポーリング監視でエージェントホストの状態が回復しないときに,同じエージェントホストで実行中のジョブをすべて終了状態※にするように設定できます。実行エージェントグループで運用している場合は,同じ実行エージェントグループで実行中のジョブのうち,同じエージェントホストで実行中のジョブをすべて終了状態にします。これによって,早急なリカバリーができます。
- 注※
-
ジョブネットに定義されているジョブの場合は,ジョブの状態を「強制終了」に変更し,終了コードに-1を設定します。jpqjobsubコマンドで実行するサブミットジョブの場合は,-rsオプションで指定した状態(デフォルトは「保留」)に変更します。
通信障害時に実行中のジョブをすべて終了状態にする設定方法について,次に説明します。
- 〈この項の構成〉
(1) 定義手順
-
次のコマンドを実行して,プロセスがすべて停止していることを確認します。
# /etc/opt/jp1ajs2/jajs_stop※ # /opt/jp1ajs2/bin/jajs_spmd_status
- 注※
-
自動停止の設定がされていることを確認します。
-
次のコマンドを実行して,「(2) 環境設定パラメーター一覧」の環境設定パラメーターを設定する。
jajs_config -k 定義キー名 "環境設定パラメーター名"=定義内容
-
JP1/AJS3を再起動する。
設定した内容が反映されます。
(2) 環境設定パラメーター一覧
定義キー |
環境設定パラメーター |
定義内容 |
---|---|---|
|
"ExecutingJobChangeStatus"= |
通信障害時に実行中のジョブをすべて終了状態にする設定 |
- 注※
-
{JP1_DEFAULT|論理ホスト名}の部分は,物理ホストの場合は「JP1_DEFAULT」を,論理ホストの場合は「論理ホスト名」を指定します。
環境設定パラメーターの定義内容の詳細については,「20.5.2(23) ExecutingJobChangeStatus」を参照してください。