Hitachi

JP1 Version 10 JP1/Automatic Job Management System 3 構築ガイド1


6.2.8 TCP/IP通信接続エラーのリトライ間隔・回数の変更

ジョブ実行制御ではジョブの登録,ジョブの配信,ジョブの状態通知,ジョブの状態確認またはエージェントホストの状態確認を行う際,プロセス間で情報を受け渡しするためにTCP/IP通信を使用しています。接続先のホストが起動していない場合やネットワーク障害が発生している場合,TCP/IP通信の接続エラーが発生します。

このとき,ジョブ実行制御のTCP/IP通信処理では,最初の接続要求に対して通信相手から応答がなかった場合に最大で90秒待ち,その後,20秒の間隔をおいて2回再接続を試みます(デフォルト値の場合)。このため,リトライがすべて失敗し最終的に接続エラーとなるまでにおよそ4〜5分掛かることがあります。

ジョブの登録,ジョブの配信,ジョブの状態通知,ジョブの状態確認またはエージェントホストの状態確認を行う際に通信障害が発生すると,その検知に遅れが生じることがあります。障害の検知が遅れることによって,結果的にジョブの状態を変更するまでの時間が遅れます。

TCP/IP通信の接続エラーが頻繁に発生する場合は,接続タイムアウト時間,リトライ回数,リトライ間隔を短く設定変更することで,障害状態をより早く検知できます。

エージェントホストへのジョブの配信,ジョブの状態確認,またはエージェントホストの状態確認のマネージャー側での設定変更については,マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.6 通信制御の環境設定」を参照してください。

ソケットポート不足による通信エラー時の注意事項

単位時間当たりのジョブ実行数が多くなると,TCP/IP通信が増加しソケットポート不足が発生することがあります。ソケットポート不足による通信エラーの場合も一定間隔をおいて再接続を試みますが,再接続までの間にソケットポート不足が解消されなかった場合,ジョブ実行遅延,ジョブ異常終了,スケジューラーサービス異常終了,およびコマンド異常終了が発生することがあります。

ソケットポート不足が発生する場合は,マニュアル「JP1/Automatic Job Management System 3 設計ガイド(システム構築編) 3.1.1(5) OSのチューニング」を参照し,OSのパラメーターの調整を検討してください。

なお,ソケットポート不足による通信エラーが発生した場合のJP1/AJS3の再試行の動作はOSによって異なります。

  • Windows Server 2003の場合

    表6-21およびマニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.6 通信制御の環境設定」の環境設定パラメーター一覧(通信制御)にある環境設定パラメーターは,ソケットポート不足による通信エラーは対象外です。ソケットポート不足による通信エラーの場合,再接続の間隔・回数は変更できません。20秒の間隔をおいて48回(計960秒)の再接続を試み,ソケットポートが利用できる状態かどうかを確認します。

  • Windows Server 2003以外の場合

    表6-21およびマニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.6 通信制御の環境設定」の環境設定パラメーター一覧(通信制御)にある環境設定パラメーターは,ソケットポート不足による通信エラーも対象となります。

環境設定パラメーターの値を変更する定義キーと,使用目的を次の表に示します。

表6‒20 値を変更する定義キー

定義キー

使用目的

  • スケジューラーサービス(共通)の場合

    JP1AJS2\SCHEDULER\QUEUE\MANAGER\Network

  • スケジューラーサービス(個別)の場合

    JP1AJSMANAGER\スケジューラーサービス名\QUEUE\MANAGER\Network

  • サブミットジョブおよび互換用ISAM構成の場合

    JP1NBQMANAGER\Network

ジョブの状態通知

JP1NBQAGENT\Network

ジョブの状態通知

JP1NBQCLIENT\Network

スケジューラーからのジョブの登録,ジョブ実行に使用するコマンド

  • スケジューラーサービス(共通)の場合

    JP1AJS2\SCHEDULER\QUEUE\NOTIFY\Network

  • スケジューラーサービス(個別)の場合

    JP1AJSMANAGER\スケジューラーサービス名\QUEUE\NOTIFY\Network

  • サブミットジョブおよび互換用ISAM構成の場合

    JP1NBQNOTIFY\Network

他システム(JP1/NQSEXECやJP1/OJEなど)のジョブの状態確認,および状態通知

ジョブ実行制御の接続タイムアウト,リトライ間隔・回数の設定手順を次に示します。

なお,キューレスジョブ実行機能では,次に示す設定は必要ありません。

〈この項の構成〉

(1) 定義手順

  1. Windowsの[コントロールパネル]の[管理ツール]で[サービス]を選択し,次に示すサービスを停止する。

    • JP1/AJS3サービス

  2. 次のコマンドを実行して,「(2) 環境設定パラメーター一覧」の環境設定パラメーターを設定する。

    jajs_config -k 定義キー名 "環境設定パラメーター名"=定義内容
    ["環境設定パラメーター名2"=定義内容2] 
    ["環境設定パラメーター名3"=定義内容3]

    定義キー名に指定できる定義キーは一つです。異なる定義キーの環境設定パラメーターを設定する場合は,定義キーごとにjajs_configコマンドを実行する必要があります。

  3. JP1/AJS3を再起動する。

    設定した内容が反映されます。

(2) 環境設定パラメーター一覧

表6‒21 ジョブ実行制御のTCP/IP通信環境設定パラメーター

項番

定義キー

環境設定パラメーター

定義内容

1

  • スケジューラーサービス(共通)の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1AJS2\SCHEDULER\QUEUE\MANAGER\Network]

  • スケジューラーサービス(個別)の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1AJSMANAGER\スケジューラーサービス名\QUEUE\MANAGER\Network]

  • サブミットジョブおよび互換用ISAM構成の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1NBQMANAGER\Network]

"ConnectTimeout"=

ジョブ実行制御マネージャーのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒)

2

"CommunicateRetryCount"=

ジョブ実行制御マネージャーのTCP/IP通信接続エラーのリトライ回数の定義

3

"CommunicateRetryInterval"=

ジョブ実行制御マネージャーのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒)

4

[{JP1_DEFAULT|論理ホスト名}\JP1NBQAGENT\Network]

"ConnectTimeout"=

ジョブ実行制御エージェントのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒)

5

"CommunicateRetryCount"=

ジョブ実行制御エージェントのTCP/IP通信接続エラーのリトライ回数の定義

6

"CommunicateRetryInterval"=

ジョブ実行制御エージェントのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒)

7

[{JP1_DEFAULT|論理ホスト名}\JP1NBQCLIENT\Network]

"ConnectTimeout"=

ジョブ実行に使用するコマンドおよびスケジューラーのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒)

8

"CommunicateRetryCount"=

ジョブ実行に使用するコマンドおよびスケジューラーのTCP/IP通信接続エラーのリトライ回数の定義

9

"CommunicateRetryInterval"=

ジョブ実行に使用するコマンドおよびスケジューラーのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒)

10

  • スケジューラーサービス(共通)の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1AJS2\SCHEDULER\QUEUE\NOTIFY\Network]

  • スケジューラーサービス(個別)の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1AJSMANAGER\スケジューラーサービス名\QUEUE\NOTIFY\Network]

  • サブミットジョブおよび互換用ISAM構成の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1NBQNOTIFY\Network]

"ConnectTimeout"=

ジョブ実行制御状態通知プロセスのTCP/IP通信接続タイムアウト値の定義(単位:ミリ秒)

11

"CommunicateRetryCount"=

ジョブ実行制御状態通知プロセスのTCP/IP通信接続エラーのリトライ回数の定義

12

"CommunicateRetryInterval"=

ジョブ実行制御状態通知プロセスのTCP/IP通信接続エラーのリトライ間隔の定義(単位:秒)

注※

{JP1_DEFAULT|論理ホスト名}の部分は,物理ホストの場合は「JP1_DEFAULT」を,論理ホストの場合は「論理ホスト名」を指定します。

環境設定パラメーターの定義内容の詳細については,次の個所を参照してください。

  1. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(24) ConnectTimeout」

  2. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(25) CommunicateRetryCount」

  3. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(26) CommunicateRetryInterval」

  4. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(67) ConnectTimeout」

  5. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(68) CommunicateRetryCount」

  6. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(69) CommunicateRetryInterval」

  7. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(75) ConnectTimeout」

  8. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(76) CommunicateRetryCount」

  9. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(77) CommunicateRetryInterval」

  10. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(82) ConnectTimeout」

  11. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(83) CommunicateRetryCount」

  12. マニュアル「JP1/Automatic Job Management System 3 構築ガイド2 2.3.2(84) CommunicateRetryInterval」