15.2.8 TCP/IP通信接続エラーのリトライ間隔・回数の変更

ジョブ実行制御ではジョブの登録,ジョブの配信,ジョブの状態通知,ジョブの状態確認またはエージェントホストの状態確認を行う際,プロセス間で情報を受け渡しするためにTCP/IP通信を使用しています。接続先のホストが起動していない場合やネットワーク障害が発生している場合,TCP/IP通信の接続エラーが発生します。

このとき,ジョブ実行制御のTCP/IP通信処理では,最初の接続要求に対して通信相手から応答がなかった場合に最大で90秒待ち,その後,20秒の間隔をおいて2回再接続を試みます(デフォルト値の場合)。このため,リトライがすべて失敗し最終的に接続エラーとなるまでにおよそ4~5分掛かることがあります。

ジョブの登録,ジョブの配信,ジョブの状態通知,ジョブの状態確認またはエージェントホストの状態確認を行う際に通信障害が発生すると,その検知に遅れが生じることがあります。障害の検知が遅れることによって,結果的にジョブの状態を変更するまでの時間が遅れます。

TCP/IP通信の接続エラーが頻繁に発生する場合は,接続タイムアウト時間,リトライ回数,リトライ間隔を短く設定変更することで,障害状態をより早く検知できます。

エージェントホストへのジョブの配信,ジョブの状態確認,またはエージェントホストの状態確認のマネージャー側での設定変更については,マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.6 通信制御の環境設定」を参照してください。

環境設定パラメーターの値を変更する定義キーと,使用目的を次の表に示します。

表15-17 値を変更する定義キー

定義キー使用目的
  • スケジューラーサービス(共通)の場合
    JP1AJS2¥SCHEDULER¥QUEUE¥MANAGER¥Network
  • スケジューラーサービス(個別)の場合
    JP1AJSMANAGER¥スケジューラーサービス名¥QUEUE¥MANAGER¥Network
  • サブミットジョブおよび互換用ISAM構成の場合
    JP1NBQMANAGER¥Network
ジョブの状態通知
JP1NBQAGENT¥Networkジョブの状態通知
JP1NBQCLIENT¥Networkスケジューラーからのジョブの登録,ジョブ実行に使用するコマンド
  • スケジューラーサービス(共通)の場合
    JP1AJS2¥SCHEDULER¥QUEUE¥NOTIFY¥Network
  • スケジューラーサービス(個別)の場合
    JP1AJSMANAGER¥スケジューラーサービス名¥QUEUE¥NOTIFY¥Network
  • サブミットジョブおよび互換用ISAM構成の場合
    JP1NBQNOTIFY¥Network
他システム(JP1/NQSEXECやJP1/OJEなど)のジョブの状態確認,および状態通知

ジョブ実行制御の接続タイムアウト,リトライ間隔・回数の設定手順を次に示します。

なお,キューレスジョブ実行機能では,次に示す設定は必要ありません。

<この項の構成>
(1) 定義手順
(2) 環境設定パラメーター一覧

(1) 定義手順

  1. JP1/AJS3のサービスを停止する。
    次のコマンドを実行して,プロセスがすべて停止していることを確認します。

    # /etc/opt/jp1ajs2/jajs_stop
    # /opt/jp1ajs2/bin/jajs_spmd_status

    注※
    自動停止の設定がされていることを確認してください。
  2. 次のコマンドを実行して,「(2) 環境設定パラメーター一覧」の環境設定パラメーターを設定する。

    jajs_config -k 定義キー名 "環境設定パラメーター名"=定義内容
    ["環境設定パラメーター名2"=定義内容2]
    ["環境設定パラメーター名3"=定義内容3]

    定義キー名に指定できる定義キーは一つです。異なる定義キーの環境設定パラメーターを設定する場合は,定義キーごとにjajs_configコマンドを実行する必要があります。
  3. JP1/AJS3を再起動する。
    設定した内容が反映されます。

(2) 環境設定パラメーター一覧

表15-18 ジョブ実行制御のTCP/IP通信環境設定パラメーター

項番定義キー環境設定パラメーター定義内容
1
  • スケジューラーサービス(共通)の場合
    [{JP1_DEFAULT|論理ホスト名}¥JP1AJS2¥SCHEDULER¥QUEUE¥MANAGER¥Network]
  • スケジューラーサービス(個別)の場合
    [{JP1_DEFAULT|論理ホスト名}¥JP1AJSMANAGER¥スケジューラーサービス名¥QUEUE¥MANAGER¥Network]
  • サブミットジョブおよび互換用ISAM構成の場合
    [{JP1_DEFAULT|論理ホスト名}¥JP1NBQMANAGER¥Network]
"ConnectTimeout"=ジョブ実行制御マネージャーのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒)
2"CommunicateRetryCount"=ジョブ実行制御マネージャーのTCP/IP通信接続エラーのリトライ回数の定義
3"CommunicateRetryInterval"=ジョブ実行制御マネージャーのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒)
4[{JP1_DEFAULT|論理ホスト名}¥JP1NBQAGENT¥Network]"ConnectTimeout"=ジョブ実行制御エージェントのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒)
5"CommunicateRetryCount"=ジョブ実行制御エージェントのTCP/IP通信接続エラーのリトライ回数の定義
6"CommunicateRetryInterval"=ジョブ実行制御エージェントのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒)
7[{JP1_DEFAULT|論理ホスト名}¥JP1NBQCLIENT¥Network]"ConnectTimeout"=ジョブ実行に使用するコマンドおよびスケジューラーのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒)
8"CommunicateRetryCount"=ジョブ実行に使用するコマンドおよびスケジューラーのTCP/IP通信接続エラーのリトライ回数の定義
9"CommunicateRetryInterval"=ジョブ実行に使用するコマンドおよびスケジューラーのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒)
10
  • スケジューラーサービス(共通)の場合
    [{JP1_DEFAULT|論理ホスト名}¥JP1AJS2¥SCHEDULER¥QUEUE¥NOTIFY¥Network]
  • スケジューラーサービス(個別)の場合
    [{JP1_DEFAULT|論理ホスト名}¥JP1AJSMANAGER¥スケジューラーサービス名¥QUEUE¥NOTIFY¥Network]
  • サブミットジョブおよび互換用ISAM構成の場合
    [{JP1_DEFAULT|論理ホスト名}¥JP1NBQNOTIFY¥Network]
"ConnectTimeout"=ジョブ実行制御状態通知プロセスのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒)
11"CommunicateRetryCount"=ジョブ実行制御状態通知プロセスのTCP/IP通信接続エラーのリトライ回数の定義
12"CommunicateRetryInterval"=ジョブ実行制御状態通知プロセスのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒)
注※
{JP1_DEFAULT|論理ホスト名}の部分は,物理ホストの場合は「JP1_DEFAULT」を,論理ホストの場合は「論理ホスト名」を指定します。

環境設定パラメーターの定義内容の詳細については,次の個所を参照してください。

  1. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(24) ConnectTimeout」
  2. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(25) CommunicateRetryCount」
  3. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(26) CommunicateRetryInterval」
  4. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(67) ConnectTimeout」
  5. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(68) CommunicateRetryCount」
  6. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(69) CommunicateRetryInterval」
  7. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(75) ConnectTimeout」
  8. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(76) CommunicateRetryCount」
  9. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(77) CommunicateRetryInterval」
  10. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(81) ConnectTimeout」
  11. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(82) CommunicateRetryCount」
  12. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3(83) CommunicateRetryInterval」