2.5.5 ジョブ配信遅延の軽減の検討
マネージャーホストから複数の実行エージェントに,同一時刻にジョブを配信した場合,3台以上の実行エージェントで通信障害が発生していると,正常に通信できる実行エージェントへのジョブの配信が遅延するおそれがあります。このような場合に,マネージャーホストから実行エージェントへの通信状態を確認し,通信障害が発生している実行エージェントへのジョブ配信を抑止できます。これによって,ジョブの配信遅延を軽減できます。これをジョブ配信遅延の軽減機能と呼びます。
ジョブ配信遅延の軽減機能を有効にする手順については,マニュアル「JP1/Automatic Job Management System 3 構築ガイド 21.5 ジョブの配信遅延を軽減するための設定」を参照してください。
- 〈この項の構成〉
(1) ジョブ配信遅延の軽減機能の概要
ジョブ配信遅延の軽減機能では,マネージャーホストで実行エージェントの状態を管理します。実行エージェントの状態は,次のどれかに分類されます。
項番 |
状態 |
説明 |
---|---|---|
1 |
未確認 |
実行エージェントの状態が確認されていない状態 実行エージェントへジョブは配信できます。 |
2 |
接続可 |
実行エージェントと正常に通信できる状態 実行エージェントへジョブは配信できます。 |
3 |
接続不可 |
実行エージェントに通信障害が発生しているため,ジョブを配信できない状態 実行エージェントへジョブは配信できません(ジョブはマネージャーホスト上で「キューイング」状態となります)。 |
4 |
使用不可 |
ajsagtaltコマンドで明示的にジョブ配信を抑止している状態 実行エージェントへジョブは配信できません(ジョブはマネージャーホスト上で「キューイング」状態となります)。 |
マネージャーホストが実行エージェントでの通信障害を検知していない場合,実行エージェントの状態は「未確認」になります(初期状態)。マネージャーホストは,「未確認」の実行エージェントにジョブを配信します。
実行エージェントへの通信障害を検知すると,マネージャーホストは実行エージェントの状態の監視を開始します。実行エージェントの状態の遷移について,次に説明します。
-
マネージャーホストは,「キューイング」状態のジョブがある実行エージェント,および「キューイング」状態のジョブがある実行エージェントグループのすべての接続先実行エージェントのうち「未確認」または「接続可」の実行エージェントに対して,通信状態を確認します(通信状態確認)。
通信状態確認の結果,実行エージェントは次のどちらかの状態に遷移します。
-
接続可
-
接続不可
-
-
「接続可」の実行エージェントにはジョブを配信し,「接続不可」の実行エージェントにはジョブの配信を抑止します。
「接続可」の実行エージェントに配信されたジョブは,実行エージェントで実行されます。「接続可」の実行エージェントは,1時間経過すると「未確認」に遷移します。
実行エージェントが「接続不可」で,配信が抑止されたジョブは,「キューイング」状態のまま実行エージェントの通信障害の回復を待ちます。障害回復待ち時間※が経過(イベントジョブの場合,未通知の再送が終了)しても実行エージェントが回復しない場合,ジョブは「起動失敗」になります。
- 注※
-
エージェントの障害回復待ち時間の詳細については,マニュアル「JP1/Automatic Job Management System 3 構築ガイド 6.2.12 エージェントの障害回復待ち時間を短縮する設定方法」(Windowsの場合)または「JP1/Automatic Job Management System 3 構築ガイド 15.2.12 エージェントの障害回復待ち時間を短縮する設定方法」(UNIXの場合)を参照してください。
実行エージェントの状態に応じたジョブの配信について次の図に示します。
図2‒50 実行エージェントの状態に応じたジョブの配信 -
「接続不可」の実行エージェントに対して,マネージャーホストは定期的に接続状態を確認します(通信状態回復確認)。
通信状態回復確認は,通信障害が回復するまで繰り返されます。
-
通信状態回復確認の結果,実行エージェントは次のどちらかの状態に遷移します。
-
接続可
通信障害が回復すると実行エージェントは「接続可」になり,ジョブの配信が開始されます。「接続不可」の実行エージェントが存在しなくなると,通信状態回復確認は終了します。
-
未確認
24時間(デフォルト)以内に通信障害が回復しなかった場合は,状態が「接続不可」から「未確認」に遷移し,通信状態回復確認が打ち切られます。
-
- 補足事項
-
ジョブの実行先に実行エージェントグループが指定されていた場合には,実行エージェントグループに関連付けされている「接続可」または「未確認」の実行エージェントの内,優先順位が最も高い実行エージェントに対してジョブを配信します。
(2) ジョブ配信遅延の軽減機能の対象のジョブ
ジョブ配信遅延の軽減機能の対象となるジョブを次に示します。
-
UNIXジョブ(キューレスジョブを除く)
-
PCジョブ(キューレスジョブを除く)
-
フレキシブルジョブ
JP1/AJS3 - Managerと中継エージェントに指定したJP1/AJS3 - Agentとの間の通信だけが対象です。JP1/AJS3 - Agentと宛先エージェント間の通信は対象外です。
-
イベントジョブ
-
アクションジョブ(キューレスジョブを除く)
-
カスタムジョブ
-
引き継ぎ情報設定ジョブ
-
HTTP接続ジョブ
JP1/AJS3 - ManagerとHTTP接続ジョブを実行するJP1/AJS3 - Agentとの間の通信だけが対象です。JP1/AJS3 - AgentとWebサーバ間の通信は対象外です。
(3) ジョブ配信遅延の軽減機能の監視間隔
ジョブ配信遅延の軽減機能による,接続タイムアウト時間,通信状態回復確認の実行間隔,および打ち切り時間は,環境設定パラメーターで設定できます。環境設定パラメーターで設定できる値を次に示します。
|
-
通信状態確認または通信状態回復確認の時間(接続タイムアウト時間)です。環境設定パラメーターAGMCONNECTTIMEOUTで指定します。デフォルトは10秒です。
-
通信状態回復確認の実行間隔です。環境設定パラメーターAGMINTERVALFORRECOVERで指定します。デフォルトは180秒です。
-
実行エージェントの状態を「接続不可」から「未確認」に戻す時間です。環境設定パラメーターAGMERRAGTSTATRESETTIMEで指定します。デフォルトは24時間です。
(4) ジョブ配信遅延の軽減機能使用時のジョブの強制終了
ジョブ配信遅延の軽減機能を使用すると,ジョブの強制終了要求の配信時に通信障害が発生しても,ジョブ配信遅延は発生しません。ジョブ配信時と同様に,「接続可」または「未確認」の実行エージェントにはジョブの強制終了要求を配信し,「接続不可」または「使用不可」の実行エージェントにはジョブの強制終了要求の配信を抑止します。ジョブの強制終了要求が抑止されたジョブは,「異常検出終了」になり,統合トレースログにメッセージKAVU4221-Eを出力します。ただし,ジョブから実行したユーザープログラムは強制終了されません。
(5) 実行エージェントを計画的に停止する運用をしている場合
ジョブ配信遅延の軽減機能を使用する場合,メンテナンスなどで計画的に実行エージェントを停止するときには,停止していない実行エージェントへのジョブの配信が遅延するのを防ぐために,次の両方の設定をしてください。
-
ajsagtaltコマンドでジョブの受付配信制限の状態を「保留」または「閉塞」にする
-
ajsagtaltコマンドで実行エージェントの状態を「使用不可」にする
計画的に停止している実行エージェントの状態を「使用不可」にしない場合,通信状態確認で実行エージェントの状態は「接続不可」となります。この場合,実行エージェントの状態が「未確認」になるまで停止中の実行エージェントに通信状態回復確認するため,障害検知が遅延するおそれがあります。なお,状態を「使用不可」とした実行エージェントに再度ジョブを配信する場合は,ajsagtaltコマンドで実行エージェントの状態を「未確認」に設定してください。
(6) ジョブの受付配信制限とジョブ配信遅延の軽減機能の関係
ジョブの受付配信制限の状態とジョブ配信遅延の軽減機能での実行エージェントの状態を,組み合わせたときのジョブの状態遷移を次の表に示します。ジョブの受付配信制限の詳細については,マニュアル「JP1/Automatic Job Management System 3 導入ガイド 5.2 ジョブの受付配信制限」を参照してください。
受付配信制限の状態(英語名) |
実行エージェントの状態 |
ジョブの状態遷移 |
イベントジョブの状態遷移 |
---|---|---|---|
有効(Effective) |
「未確認」 「接続可」 |
キューイング→実行中→終了 |
キューイング→実行中→終了(配信制限の対象にならない) |
「接続不可」 「使用不可」 |
キューイング→起動失敗(エージェントの障害回復待ち時間が経過したあと起動失敗になる) |
キューイング→起動失敗 |
|
無効(Ineffective) |
「未確認」 「接続可」 |
即時に起動失敗(「キューイング」状態のジョブは「有効」状態と同じ) |
キューイング→実行中→終了(配信制限の対象にならない) |
「接続不可」 「使用不可」 |
即時に起動失敗(「キューイング」状態のジョブはエージェントの障害回復待ち時間が経過したあと起動失敗になる) |
キューイング→起動失敗 |
|
保留(Hold) |
「未確認」 「接続可」 |
キューイング |
キューイング→実行中→終了(配信制限の対象にならない) |
「接続不可」 「使用不可」 |
キューイング |
キューイング→起動失敗 |
|
閉塞(Blockade) |
「未確認」 「接続可」 |
即時に起動失敗(「キューイング」状態のジョブは「保留」状態と同じ) |
キューイング→実行中→終了(配信制限の対象にならない) |
「接続不可」 「使用不可」 |
即時に起動失敗(「キューイング」状態のジョブは「保留」状態と同じ) |
キューイング→起動失敗 |
(7) ジョブ配信遅延の軽減機能の注意事項
実行エージェントの状態を「接続可」と判定してから1時間経過すると,実行エージェントの状態は「未確認」に遷移します。「接続可」から「未確認」の状態に変更されるまでの間に,「接続可」と判定された実行エージェントのうち3台以上で新たに通信障害が発生し,それらの実行エージェントに対して同時にジョブを配信しようとすると,ジョブの配信が遅延することがあります。ジョブ配信遅延の軽減機能を有効にする場合,エージェント監視プロセス(ajsagtmond)は停止しないでください。エージェント監視プロセスを停止した場合,次に示す動作となります。
-
実行エージェントの状態が「使用不可」の場合を除き,実行エージェントの状態に関係なくジョブを配信する
-
通信できない実行エージェントが3台以上あり,それらの実行エージェントに対してジョブを配信すると,正常な実行エージェントへのジョブの配信が遅延する(ジョブ配信遅延の軽減機能が無効のときと同じ)
-
エージェント監視プロセスの停止中に,障害を検知した実行エージェントの回復の検知が遅延する(ジョブ配信遅延の軽減機能が無効のときと同じ)