2.5.6 ジョブの状態遷移遅延の軽減の検討
マネージャーホストが複数の実行エージェントと通信している構成で,一つ以上の実行エージェントへの応答の通信で障害が発生した場合,マネージャーホストは最大で10分間,実行エージェントに応答を続けます。このとき,ジョブの状態が10分間遷移しなくなるなど,ジョブの実行で遅延が発生するおそれがあります。また,通信障害の影響で,正常に通信できる実行エージェントで実行したジョブの状態遷移でも,10分以上の遅延が発生するおそれがあります。
このような場合に,マネージャーホストから正常に応答の通信ができない実行エージェントへの応答を抑止し,正常な実行エージェントからの通知に応答するようにできます。これによって,ジョブの状態遷移遅延を軽減できます。これをジョブの状態遷移遅延の軽減機能と呼びます。
- 〈この項の構成〉
(1) ジョブの状態遷移遅延の軽減機能の概要
ジョブの状態遷移遅延の軽減機能を使用すると,通信障害が発生している実行エージェントへの応答を抑止できます。このため,正常な実行エージェントで実行するジョブの状態遷移の遅延を軽減できます。実行エージェントとの通信で障害が発生した場合のジョブの状態遷移の例を次の図に示します。
|
この機能の対象となる通信を次の表に示します。
サービス名 |
ポート番号 |
用途 |
---|---|---|
jp1ajs2qman |
20241/tcp |
マネージャーのジョブ※1の登録受付用 ジョブ※1の標準出力ファイル,標準エラー出力ファイル受付用 jp1exec,jp1exit以外のジョブの実行に使用するコマンド※2要求受付用 JP1/OJE for VOS3とのジョブ連携用(ジョブの登録受付用) |
jp1ajs2qnfy |
20243/tcp |
マネージャーのジョブ※1の開始通知,終了通知受付用 |
jp1ajs2eamgr |
20246/tcp |
マネージャーのイベントジョブおよびカスタムイベントジョブ実行用 |
- 注※1
-
キューレスジョブを除く標準ジョブ,HTTP接続ジョブ,アクションジョブ,およびカスタムジョブを指します。
- 注※2
-
ジョブの実行に使用するコマンドについては,マニュアル「JP1/Automatic Job Management System 3 コマンドリファレンス 1.5 コマンド一覧」の,ジョブの実行に使用するコマンド一覧の表を参照してください。
ジョブの状態遷移遅延の軽減機能は,デフォルトでは無効になっています。有効にするには,次の二つの環境設定パラメーターを設定します。
-
ResponseTimeout
-
ReduceStateTransitionDelay
ジョブの状態遷移遅延の軽減機能を有効にする手順については,マニュアル「JP1/Automatic Job Management System 3 構築ガイド 20.8.2 通信制御の環境設定パラメーターの詳細」を参照してください。
(2) ジョブの状態遷移遅延の軽減機能の対象のジョブ
ジョブの状態遷移遅延の軽減機能の対象となるジョブを次に示します。
-
PCジョブ(キューレスジョブを除く)
-
UNIXジョブ(キューレスジョブを除く)
-
アクションジョブ(キューレスジョブを除く)
-
サブミットジョブ
-
QUEUEジョブ
-
カスタムジョブ
-
HTTP接続ジョブ
-
引き継ぎ情報設定ジョブ
-
フレキシブルジョブ
-
イベントジョブ
-
カスタムイベントジョブ
(3) 実行エージェントとの通信の監視間隔
ジョブの状態遷移遅延の軽減機能を有効にした場合,マネージャーホストは,通信障害を検知してから5分間,通信障害が発生した実行エージェントへの応答を抑止します。5分間が経過したあと,通信が回復していれば応答の抑止を終了します。通信が回復していなければ,再び5分間応答を抑止します。実行エージェントとの通信の監視間隔を次に示します。
|
-
マネージャーホストが実行エージェントからの通知に応答するときの,通信障害を検知するまでの時間です。環境設定パラメーターResponseTimeoutで変更できます。デフォルトは10秒です。
-
マネージャーホストが実行エージェントへの応答を抑止する時間です。5分で固定です。
-
実行エージェントがマネージャーホストに通知を再送する間隔です。ジョブごとに環境設定パラメーターで指定できます。対象となるジョブと環境設定パラメーターを次の表に示します。
表2‒45 対象となるジョブと環境設定パラメーター ジョブ
環境設定パラメーター
標準ジョブ(キューレスジョブを除く)
-
NotfyJobStateInterval
-
NotfyJobStateCount
HTTP接続ジョブ
アクションジョブ
カスタムジョブ
イベントジョブ,カスタムイベントジョブ
-
NotificationRetryInterval
-
NotificationRetryCount
-
実行エージェントへの応答に失敗し,通信障害を検知した場合,マネージャーホストは統合トレースログにメッセージKNAC0403-Wを出力します。メッセージKNAC0403-Wは,通信障害が発生した実行エージェントのIPアドレスごとに出力されます。通信障害が発生した実行エージェントとの通信が回復した場合は,統合トレースログにメッセージKNAC0402-Iが出力されます。通信が回復したあと,またはJP1/AJS3サービスを停止したあとに再度通信障害が発生した場合は,メッセージKNAC0403-Wが再度出力されます。
(4) ジョブの状態遷移遅延の軽減機能の注意事項
ジョブの状態遷移遅延の軽減機能を使用すると,通信障害から回復した場合の検知が遅れることがあります。ジョブの状態遷移遅延の軽減機能が無効の場合と,有効にした場合の,実行エージェントの通信障害からの回復を検知できるタイミングを次の図に示します。
|