ジョブ実行制御ではジョブの登録,ジョブの配信,ジョブの状態通知,ジョブの状態確認またはエージェントホストの状態確認を行う際,プロセス間で情報を受け渡しするためにTCP/IP通信を使用しています。接続先のホストが起動していない場合やネットワーク障害が発生している場合,TCP/IP通信の接続エラーが発生します。
このとき,ジョブ実行制御のTCP/IP通信処理では,最初の接続要求に対して通信相手から応答がなかった場合に最大で90秒待ち,その後,20秒の間隔をおいて2回再接続を試みます(デフォルト値の場合)。このため,リトライがすべて失敗し最終的に接続エラーとなるまでにおよそ4~5分掛かることがあります。
ジョブの登録,ジョブの配信,ジョブの状態通知,ジョブの状態確認またはエージェントホストの状態確認を行う際に通信障害が発生すると,その検知に遅れが生じることがあります。障害の検知が遅れることによって,結果的にジョブの状態を変更するまでの時間が遅れます。
TCP/IP通信の接続エラーが頻繁に発生する場合は,接続タイムアウト時間,リトライ回数,リトライ間隔を短く設定変更することで,障害状態をより早く検知できます。
エージェントホストへのジョブの配信,ジョブの状態確認,またはエージェントホストの状態確認のマネージャー側での設定変更については,マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.6 通信制御の環境設定」を参照してください。
環境設定パラメーターの値を変更する定義キーと,使用目的を次の表に示します。
表15-17 値を変更する定義キー
定義キー | 使用目的 |
---|---|
| ジョブの状態通知 |
JP1NBQAGENT¥Network | ジョブの状態通知 |
JP1NBQCLIENT¥Network | スケジューラーからのジョブの登録,ジョブ実行に使用するコマンド |
| 他システム(JP1/NQSEXECやJP1/OJEなど)のジョブの状態確認,および状態通知 |
ジョブ実行制御の接続タイムアウト,リトライ間隔・回数の設定手順を次に示します。
なお,キューレスジョブ実行機能では,次に示す設定は必要ありません。
(1) 定義手順
# /etc/opt/jp1ajs2/jajs_stop※
# /opt/jp1ajs2/bin/jajs_spmd_status
jajs_config -k 定義キー名 "環境設定パラメーター名"=定義内容
["環境設定パラメーター名2"=定義内容2]
["環境設定パラメーター名3"=定義内容3]
(2) 環境設定パラメーター一覧
表15-18 ジョブ実行制御のTCP/IP通信環境設定パラメーター
項番 | 定義キー | 環境設定パラメーター | 定義内容 |
---|---|---|---|
1 |
| "ConnectTimeout"= | ジョブ実行制御マネージャーのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒) |
2 | "CommunicateRetryCount"= | ジョブ実行制御マネージャーのTCP/IP通信接続エラーのリトライ回数の定義 | |
3 | "CommunicateRetryInterval"= | ジョブ実行制御マネージャーのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒) | |
4 | [{JP1_DEFAULT|論理ホスト名}¥JP1NBQAGENT¥Network]※ | "ConnectTimeout"= | ジョブ実行制御エージェントのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒) |
5 | "CommunicateRetryCount"= | ジョブ実行制御エージェントのTCP/IP通信接続エラーのリトライ回数の定義 | |
6 | "CommunicateRetryInterval"= | ジョブ実行制御エージェントのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒) | |
7 | [{JP1_DEFAULT|論理ホスト名}¥JP1NBQCLIENT¥Network]※ | "ConnectTimeout"= | ジョブ実行に使用するコマンドおよびスケジューラーのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒) |
8 | "CommunicateRetryCount"= | ジョブ実行に使用するコマンドおよびスケジューラーのTCP/IP通信接続エラーのリトライ回数の定義 | |
9 | "CommunicateRetryInterval"= | ジョブ実行に使用するコマンドおよびスケジューラーのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒) | |
10 |
| "ConnectTimeout"= | ジョブ実行制御状態通知プロセスのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒) |
11 | "CommunicateRetryCount"= | ジョブ実行制御状態通知プロセスのTCP/IP通信接続エラーのリトライ回数の定義 | |
12 | "CommunicateRetryInterval"= | ジョブ実行制御状態通知プロセスのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒) |
環境設定パラメーターの定義内容の詳細については,次の個所を参照してください。