Hitachi

JP1 Version 12 JP1/Automatic Job Management System 3 構築ガイド


15.3.14 イベント・アクション制御の通信に関する環境設定パラメーター

イベントジョブおよび起動条件付きジョブネットを実行すると,イベント・アクション制御マネージャーとイベント・アクション制御エージェント間で通信します。通信の際,イベント・アクション制御マネージャーとイベント・アクション制御エージェント間で接続を確立してから,イベントジョブや起動条件付きジョブネットの実行要求や強制終了要求,イベントの成立通知などを送信します。

イベントジョブや起動条件付きジョブネットを実行するときの通信の様子を,次の図に示します。

図15‒2 イベントジョブや起動条件付きジョブネットを実行するときの通信の様子

[図データ]

この通信でエラーが発生した場合,送信に失敗した情報はリトライ(再試行)に備え,いったんファイルに保存されます。この情報を未通知情報といいます。

通信エラーが発生すると,環境設定パラメーターに従って,リトライされます。

イベント・アクション制御の通信リトライに関する環境設定パラメーターを次に示します。

表15‒60 イベント・アクション制御の通信リトライに関する環境設定パラメーター

定義キー

環境設定パラメーター

定義内容

マネージャーホストの場合

[{JP1_DEFAULT|論理ホスト名}\JP1AJSMANAGER\スケジューラーサービス名\NETWORK\EVMANAGER]

エージェントホストの場合

[{JP1_DEFAULT|論理ホスト名}\JP1AOMAGENT]

"ClientConnectTimeout"=

接続タイムアウト時間

  • スケジューラーサービス(共通)の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1AJS2\SCHEDULER\EV\MANAGER]

  • スケジューラーサービス(個別)の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1AJSMANAGER\スケジューラーサービス名\EV\MANAGER]

"NotificationConstantRetry"=

未通知情報再送間隔一定化オプション

マネージャーホストの場合
  • スケジューラーサービス(共通)の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1AJS2\SCHEDULER\EV\MANAGER]

  • スケジューラーサービス(個別)の場合

    [{JP1_DEFAULT|論理ホスト名}\JP1AJSMANAGER\スケジューラーサービス名\EV\MANAGER]

エージェントホストの場合

[{JP1_DEFAULT|論理ホスト名}\JP1AOMAGENT]

"NotificationRetryInterval"=

未通知情報の再送間隔

"NotificationRetryCount"=

未通知情報の再送回数

注※

{JP1_DEFAULT|論理ホスト名}の部分は,物理ホストの場合は「JP1_DEFAULT」を,論理ホストの場合は「論理ホスト名」を指定してください。

各環境設定パラメーターの関連と設定例について説明します。

〈この項の構成〉

(1) ClientConnectTimeoutについて

イベント・アクション制御マネージャーおよびイベント・アクション制御エージェントは,接続要求を送信すると,通信相手から応答があるまで待ちます。一定時間経過しても応答がない場合は,ほかの処理をするために,いったんタイムアウトします。接続要求に対する応答を待つ時間のことを,接続タイムアウト時間といいます。

接続タイムアウト時間は,環境設定パラメーターClientConnectTimeoutで設定します。

環境設定パラメーターClientConnectTimeoutで設定する接続タイムアウト時間を,次の図に示します。

図15‒3 環境設定パラメーターClientConnectTimeoutで設定する接続タイムアウト時間

[図データ]

環境設定パラメーターClientConnectTimeoutに設定する時間を長くすると,接続タイムアウト時間が長くなります。その場合,通信負荷などが原因で通信相手から応答が届くまでに時間が掛かる場合でも,接続タイムアウトが発生しにくくなります。

しかし,ネットワーク機器の故障などで長時間,通信相手から接続要求への応答がない場合,タイムアウトするまでの時間も長くなります。その場合,イベントジョブや起動条件付きジョブネットの実行要求や強制終了要求,イベントの成立通知が処理されない時間も長くなります。タイムアウト待ちになっている間は,通信ができる別のエージェントにイベントジョブや起動条件付きジョブネットを実行登録したり,強制終了したりしても,すぐに処理できないため,ジョブの状態が変わるまでに時間が掛かります。そのため,接続タイムアウトが発生した場合,デフォルトでは一定間隔でリトライを繰り返すのではなく,間隔を徐々に長くしてリトライの頻度を下げながらリトライします。詳細については,「(2) NotificationConstantRetryについて」を参照してください。

(2) NotificationConstantRetryについて

環境設定パラメーターClientConnectTimeoutの設定によっては,ネットワーク機器の故障などが原因で接続要求に対する応答があるまでに時間が掛かる場合,イベントジョブや起動条件付きジョブネットの実行登録や強制終了が完了するまで,長時間の遅延が発生します。処理の遅延の頻度を下げるため,接続タイムアウトが発生した場合の通信リトライ間隔は,デフォルトでは一定間隔でリトライを繰り返すのではなく,300秒,600秒,900秒,1,800秒,3,600秒(以降3,600秒)と徐々に長くしながら27回(24時間)リトライするように設定されています。

接続タイムアウトが発生した場合のイベント・アクション制御マネージャーとイベント・アクション制御エージェント間での通信の様子を,次の図に示します。

図15‒4 接続タイムアウトが発生した場合のイベント・アクション制御マネージャーとイベント・アクション制御エージェント間での通信の様子

[図データ]

しかし,接続タイムアウトになる原因が通信負荷などによる一時的な原因の場合,このリトライの動作ではリトライが遅くなり,該当するエージェントで実行するイベントジョブや起動条件付きジョブネットの実行が遅れることになります。このような場合,リトライの間隔を段階的に長くする方法ではなく,一定の間隔でリトライをするように設定できます。

環境設定パラメーターNotificationConstantRetryを「Y」に設定すると,接続タイムアウト以外のエラーが発生した場合と同じ動作になり,一定間隔でリトライします。このリトライの間隔については,「(3) NotificationRetryIntervalとNotificationRetryCountについて」を参照してください。

(3) NotificationRetryIntervalとNotificationRetryCountについて

接続タイムアウト以外にも,次のような原因などで,通信がエラーになることがあります。

接続タイムアウト以外のエラーになった場合の,イベント・アクション制御マネージャーとイベント・アクション制御エージェント間での通信リトライ間隔とリトライ回数は,それぞれ環境設定パラメーターNotificationRetryInterval(デフォルト30秒)と環境設定パラメーターNotificationRetryCount(デフォルト2,880回)で設定できます。

接続タイムアウト以外のエラーが発生した場合の例を次の図に示します。

図15‒5 接続タイムアウト以外のエラーが発生した場合

[図データ]

この環境設定パラメーターの設定を変更しても,リトライする期間を変えたくない場合は,リトライ間隔とリトライ回数の両方を調整してください。例えば,リトライ間隔をデフォルト値の半分の15秒と設定した場合,リトライ回数をデフォルト値の2倍の5,760回と設定すると,リトライする期間がデフォルトの期間と同じになります。

(4) 環境設定パラメーター設定の目安

通信の際に重視したい点に合わせた,各環境設定パラメーターの設定値の目安を,次の表に示します。

表15‒61 通信の際に重視したい点と環境設定パラメーターの設定値の目安

調整が必要な環境設定パラメーター

注意事項

ClientConnectTimeoutの値

(単位:ミリ秒)

NotificationConstantRetryの値

NotificationRetryIntervalの値

(単位:秒)

NotificationRetryCountの値

デフォルト値

Windowsの場合:30,000

UNIXの場合:1,000※1

N

30

2,880/27※2

重視する点

一部のエージェントに対する通信でタイムアウトが発生する場合に,ほかのエージェント向けの処理遅延を抑止したいときの目安

3,000〜10,000

N

リトライ間隔が300秒,600秒,900秒,1,800秒,3,600秒と段階的に伸びるため,エージェントへの通信がタイムアウトしない状況になっても,次の再送までに時間が掛かります。

エージェントに対する通信でタイムアウトが発生しにくくなるようにしたいときの目安

10,000〜60,000

N

一部のエージェントに対する通信でタイムアウトが発生する場合に,ほかのエージェント向けの処理が待たされて遅延し,イベントを検知できなくなることがあります。

通信環境が安定している環境で,一時的な通信障害が発生した場合に,通信環境の回復に即応して処理遅延を抑えたいときの目安

3,000〜10,000

Y

3〜10

2,880※2

一部のエージェントに対する通信でタイムアウトが頻発・継続すると,ほかのエージェント向けの処理が待たされて遅延し,イベントを検知できなくなることがあります。

通信環境が不安定なため,通信が遅延してでも通信したいときの目安

10,000〜60,000

Y

3〜10

8,640〜28,800

一部のエージェントに対する通信でタイムアウトが頻発・継続すると,ほかのエージェント向けの処理が待たされて遅延し,イベントを検知できなくなることがあります。

早めに異常を検出したいときの目安

3,000〜10,000

Y

3〜10

30〜100

イベントジョブが異常検出終了することがあります。この場合,統合トレースログにメッセージKAVT0103-Eが出力されるため,このメッセージを監視することで通信環境の異常を検出できます。

(凡例)

−:該当しない。

注※1

WindowsとUNIXの場合でデフォルト値に大きな差がある理由は,UNIXの場合のデフォルト値がバージョン8のJP1/AJS2の設定と下位互換を保持しているためです。

バージョン8の場合,環境設定パラメーターClientConnectTimeoutは存在しませんが,この環境設定パラメーターに1,000を設定した場合と同様に動作します。UNIXの場合のデフォルト値は,この値を基にしています。

注※2

2,880回はタイムアウト以外のエラー,27回はタイムアウトエラーが続いた場合の値です。

各環境設定パラメーターの定義内容の詳細については,次の個所を参照してください。

イベント・アクション制御マネージャーからイベント・アクション制御エージェントへの通信に関する環境設定パラメーターの定義内容の詳細については,次の個所を参照してください。

イベント・アクション制御エージェントからイベント・アクション制御マネージャーへの通信に関する環境設定パラメーターの定義内容の詳細については,次の個所を参照してください。