2.2.2 マネージャー・エージェント構成の例
ジョブを複数のホストに分散させたい場合は,ジョブを管理するホスト(マネージャーホスト)にJP1/AJS3 - Managerを導入し,ジョブを実行するホスト(エージェントホスト)にJP1/AJS3 - Agentを導入します。JP1/AJS3 - Agentの代わりにJP1/AJS3 - Managerを使用することもできます。ジョブを監視するホストにはJP1/AJS3 - Viewを導入します。
- <この項の構成>
- (1) マネージャーホスト1台で運用する場合
- (2) 複数のマネージャーホストで運用する場合
- (3) 1台のエージェントホストを複数の実行ホストとして使用する場合
- (4) 業務を集中的に監視する場合
- (5) マネージャー・エージェント構成時の注意事項
(1) マネージャーホスト1台で運用する場合
1台のマネージャーホストにJP1/AJS3 - Managerを導入し,複数のエージェントホストにJP1/AJS3 - Agentを導入します。また,必要に応じてJP1/AJS3 - View用のホストを用意します。
マネージャーホスト1台で運用する場合のマネージャー・エージェント構成のシステム構成例を次の図に示します。
図2-2 マネージャー・エージェント構成のシステム構成例(マネージャーホスト1台の場合)
![[図データ]](figure/zh020005.gif)
(2) 複数のマネージャーホストで運用する場合
JP1/AJS3 - Managerを導入するホストとJP1/AJS3 - Agentを導入するホストを,それぞれ複数台用意します。また,必要に応じてJP1/AJS3 - View用ホストを用意します。
複数のマネージャーホストで運用する場合のマネージャー・エージェント構成のシステム構成例を次の図に示します。
図2-3 マネージャー・エージェント構成のシステム構成例(マネージャーホスト複数台の場合)
![[図データ]](figure/zh020010.gif)
なお,JP1/AJS3は自ホスト名からIPアドレスが解決できる環境で動作させてください。自ホスト名からIPアドレスが解決できない環境では,JP1/AJS3を起動できません。
また,複数のエージェントホストでジョブを実行させる場合は,マネージャーホスト,エージェントホスト,および他システムの各ホスト上でIPアドレスが解決できるように設定してください。DNS運用をしている場合は,FQDN形式のホスト名のIPアドレスが解決できるように設定してください。ただし,論理ホスト名には,FQDN形式のホスト名を使用できません。
(3) 1台のエージェントホストを複数の実行ホストとして使用する場合
JP1/AJS3でジョブを実行するためには,マネージャーホストにエージェントホストの情報を登録する必要があります。登録する情報として,エージェントホストの論理的な名称である実行エージェントと,対応する物理ホスト名を登録します。
ジョブの実行環境として,1台のエージェントホストに対応する実行エージェント(エージェントホストの論理的な名称)を複数作成することで,1台のエージェントホストを複数の実行ホストとして使用できます。詳細については,「2.5 ジョブの実行環境について検討する」を参照してください。
(4) 業務を集中的に監視する場合
JP1/AJS3 Consoleでは,異なるマネージャーホストで管理している業務や,異なるスケジューラーサービスまたはジョブグループで管理している業務を一つの画面で集中的に監視できます。
これらの業務をJP1/AJS3 Consoleを使って監視する場合のシステム構成例とその運用例を紹介します。
(a) 複数のマネージャーホストで管理する業務を監視する場合
複数のマネージャーホストで管理・運用する業務を集中監視する場合のシステム構成例を次に示します。
図2-4 複数のマネージャーホストで管理する業務を監視する場合のシステム構成
![[図データ]](figure/zh020015.gif)
複数のマネージャーホストで管理・運用する業務を集中監視する場合の,JP1/AJS3 Consoleでの監視例を次に示します。
図2-5 JP1/AJS3 Consoleでの監視例(複数のマネージャーホストで管理する業務を監視する場合)
![[図データ]](figure/zh020020.gif)
異なるマネージャーホストで実行される業務でも,一つの画面で集中監視できます。
(b) 1台のマネージャーホストで管理する業務を監視する場合
1台のマネージャーホストで管理する,異なるスケジューラーサービスの業務を集中監視する場合のシステム構成例を次に示します。
図2-6 1台のマネージャーホストで管理する業務を監視する場合のシステム構成
![[図データ]](figure/zh020025.gif)
1台のマネージャーホストで管理する,異なるスケジューラーサービスの業務を集中監視する場合の,JP1/AJS3 Consoleを使った監視例を次に示します。
図2-7 JP1/AJS3 Consoleでの監視例(1台のマネージャーホストで管理する業務を監視する場合)
![[図データ]](figure/zh020030.gif)
異なるスケジューラーサービスで管理される業務でも,一つの画面で集中監視できます。
(5) マネージャー・エージェント構成時の注意事項
マネージャー・エージェント構成時の注意事項を次に示します。
- マネージャーホスト・エージェントホスト間の通信では,各マシンのホスト名を使用します。マネージャーホストとエージェントホストで互いのホスト名について正しく名前解決できるように設定してください。
なお,ここでいうホスト名とは,次の方法で確認できる名前です。
- 物理ホストの場合
- JP1/AJS3ホスト上でhostnameコマンドを実行して得られるホスト名
- 論理ホストの場合(Windowsの場合)
- JP1/AJS3を運用しているホスト上で,[コントロールパネル]ウィンドウで[サービス]を選択する,または[管理ツール]-[サービス]を選択し,[サービス]ウィンドウで表示される「JP1/AJS3_xxxxx」の「xxxxx」部分に表示されるホスト名
- 論理ホストの場合(UNIXの場合)
- psコマンドを実行し,jajs_spmdプロセスの後ろに表示されるホスト名
- マネージャー・エージェント構成で標準ジョブ,アクションジョブ,カスタムジョブ,またはイベントジョブがキューイング状態のままになるような場合は,次のケースに該当しないか確認してください。該当する場合は,システムの設定などを見直してください。
- マネージャーホスト上でエージェントホストの名前が解決できない,またはエージェントホスト上でマネージャーホストの名前が解決できない場合
マネージャーホストではエージェントホストのホスト名が,エージェントホストではマネージャーホストのホスト名が,互いにホスト名から名前解決できるようにそれぞれのホストでhostsファイル,DNS,またはjp1hosts情報を設定してください。jp1hosts情報の定義方法の詳細については,マニュアル「JP1/Base 運用ガイド」を参照してください。
ここでは,hostsファイルの設定例を示します。次のように設定してください。
図2-8 互いにホスト名から名前解決するためのhostsファイルの設定例
![[図データ]](figure/zh020035.gif)
- マネージャーホストで,エージェントホスト名についてエイリアス定義をしていて,エージェントホスト上でhostnameコマンドを実行して得られるホスト名と,エイリアス定義で指定したホスト名で,同じIPアドレスが得られない場合
次のように設定してください。
図2-9 ホスト名をエイリアス定義する場合のhostsファイルの設定例
![[図データ]](figure/zh020040.gif)
- マネージャーホスト側ではhostsファイルにエージェントホスト名をFQDN形式で定義しているが,エージェントホスト上でhostnameコマンドを実行して得られるホスト名はショート名になっているためマネージャーホスト上で名前解決できない,またはその逆で,マネージャーホスト側ではhostsファイルにエージェントホスト名をショート名で定義しているが,エージェントホスト上でhostnameコマンドを実行して得られるホスト名はFQDN形式になっているためマネージャーホスト上で名前解決できない場合
名前解決できない例を次に示します。
図2-10 hostsファイルでホスト名をFQDN形式で定義している例
![[図データ]](figure/zh020045.gif)
図2-11 hostsファイルでホスト名をショート名で定義している例
![[図データ]](figure/zh020050.gif)
このような場合,ジョブを実行できてもマネージャーホスト・エージェントホスト間でジョブの一連の通信が完結しないため,マネージャーホスト側やエージェントホスト側に大量の再試行用データが滞留することがあります。また,それらのデータの再試行によって次の現象が発生することがあります。
・システムが高負荷状態になり,実行したジョブがキューイング状態のままになったり,イベントの検知が極端に遅れたり,またはイベントを検知しなくなったりする。
・エージェントのJP1/AJS3サービスを再起動すると,過去に検知したイベントが再検知される。
後者の現象は,エージェントホストの再起動時にイベントを検知した旨の再試行用データがある場合に,マネージャーホストに再通知する機能が働くために発生します。
これらの現象が発生した場合は,マネージャーホストとエージェントホストのJP1/AJS3サービスをいったん停止し,マネージャーホスト・エージェントホスト間で互いにホスト名とショート名の両方で名前解決できるように設定したあと,マネージャーホストとエージェントホストのJP1/AJS3サービスをコールドスタートしてください。そのあと,必要に応じてジョブネットを実行登録し直してください。
- 物理ホストに優先的に割り当てられるIPアドレスがループバックアドレス(127.0.0.1)にならないように名前解決の設定をしてください。ただし,運用上,物理ホストに優先的に割り当てられるIPアドレスをループバックアドレスにする必要がある場合は,jp1hosts情報を設定して物理ホストに他ホストと通信できるIPアドレスを指定してください。jp1hosts情報の定義方法の詳細については,マニュアル「JP1/Base 運用ガイド」を参照してください。
- マネージャーホスト・エージェントホスト間はネットワークで接続されています。ジョブ実行時にネットワークエラーなどが発生した場合の,ジョブの再試行処理を次の表に示します。
表2-3 ネットワークエラー時のジョブ再試行処理
ジョブ種別 | 再試行処理 |
---|
PCジョブ,UNIXジョブ,QUEUEジョブ,アクションジョブ,カスタムジョブ | - マネージャーホストからエージェントホストへの再試行
- 監視間隔を300秒※1として,2回再試行する。
- エージェントホストからマネージャーホストへの再試行
- ジョブの結果ファイルの転送を,再送間隔を300秒として288回(24時間)再試行する。※2
|
イベントジョブ | マネージャーホストからエージェントホストへの再試行
- エージェントホストに接続できない(タイムアウトする)場合,再送間隔を300秒,600秒,900秒,1,800秒,3,600秒(以降3,600秒)として,27回(24時間)再試行する。※3
- 上記以外のネットワークエラーの場合,再送間隔を30秒として,2,880回(24時間)再試行する。※4
エージェントホストからマネージャーホストへの再試行(イベント成立時の再試行)
- 再送間隔を10秒として,8,640回(24時間)再試行する。※4
|
キューレスジョブ(PCジョブ,UNIXジョブ,アクションジョブ) | 再試行されない。 |
- 注※1
- ジョブの実行先エージェントを監視する間隔を設定する,ジョブ実行制御の環境設定パラメーターObserveIntervalのデフォルト値です。
- 注※2
- 再送間隔と再試行回数は運用に合わせて変更できます。詳細については,マニュアル「JP1/Automatic Job Management System 3 構築ガイド1 6.2.5 ジョブの結果ファイルの再送間隔・再送回数の変更」(Windowsの場合)またはマニュアル「JP1/Automatic Job Management System 3 構築ガイド1 15.2.5 ジョブの結果ファイルの再送間隔・再送回数の変更」(UNIXの場合)を参照してください。
- 注※3
- エージェントホストに接続できない(タイムアウトする)場合でも,再送間隔をタイムアウトエラー以外の再送間隔で再試行するように設定できます。詳細については,マニュアル「JP1/Automatic Job Management System 3 構築ガイド1 6.3.12 未通知情報の再送間隔を一定間隔にする設定」(Windowsの場合)またはマニュアル「JP1/Automatic Job Management System 3 構築ガイド1 15.3.13 未通知情報の再送間隔を一定間隔にする設定」(UNIXの場合)を参照してください。
- 注※4
- 再送間隔と再送回数は,運用に合わせて変更できます。詳細については,マニュアル「JP1/Automatic Job Management System 3 構築ガイド1 6.3.13 未通知情報の再送間隔・再送回数の変更」(Windowsの場合)またはマニュアル「JP1/Automatic Job Management System 3 構築ガイド1 15.3.14 未通知情報の再送間隔・再送回数の変更」(UNIXの場合)を参照してください。
ネットワークエラーが発生した場合,ジョブの実行は監視時間分だけ遅延しますが,運用は続行できます。ただし,上記の監視間隔よりも長くネットワークエラーの状態が続くと,ジョブの実行結果には「起動失敗」と出力されます。
- エラーメッセージ「KAVU2227-E TCP/IP通信で接続エラーが発生しました」が出力された場合,システム全体で使用できるソケットポートが枯渇しているおそれがあります。対処方法を次に示します。
- Windowsホストの場合
- netstat -aコマンドを実行してシステムのソケットの状態を調べて,TIME_WAIT状態のソケットが多数あるかどうかを確認します。TIME_WAIT状態のソケットが多数ある場合は,一時的に空いているソケットポートが不足しているおそれがあります。通信エラーメッセージが出力される場合は,ソケット接続できないため,ジョブの実行やジョブの状態確認に失敗しているおそれがあります。このような場合は,TIME_WAIT状態のソケットが少なくなってから,ジョブを再実行してください。
- なお,Windowsが管理するTIME_WAITポートの回復時間を早めることで,通信エラーを抑止する方法もあります。TIME_WAITポートの回復時間を早める手順を次に示します。
- 1. 次のコマンドを実行して,レジストリーエディターを起動する。
- C:¥> regedt32.exe
- 2. 次に示すTCP/IPのキーを開く。
- ¥¥HKEY_LOCAL_MACHINE¥SYSTEM¥CurrentControlSet¥Services¥Tcpip¥Parameters
- 3. 次に示すレジストリー値を追加する。
- 名前:TcpTimedWaitDelay
- データ型:REG_DWORD
- データ:任意の値(10進数の値)
- 4. Windowsを再起動する。
- TcpTimedWaitDelayに指定する値は任意です。運用環境に適した値を設定してください。
- なお,標準値は240秒,最小値は30秒です。
- UNIXホストの場合
- TIME_WAIT状態のソケットが多数ある場合は,一時的に空いているソケットポートが不足しているおそれがあります。通信エラーメッセージが出力される場合は,ソケット接続できないため,ジョブの実行やジョブの状態確認に失敗しているおそれがあります。このような場合は,TIME_WAIT状態のソケットが少なくなってから,ジョブを再実行してください。
- PCジョブ,UNIXジョブ,QUEUEジョブ,アクションジョブ,およびカスタムジョブの場合,JP1/AJS3 - Managerは,実行ホスト(エージェントホスト)で実行しているジョブを5分間隔で監視します。
通信障害や実行ホストでの電源断などでジョブを確認できない状態が10分以上続くと,ジョブの状態が変更されます。ジョブネットで実行したジョブは,「異常終了」状態(終了コードは「-1」)になります。jpqjobsubコマンドで実行したジョブは,jpqjobsubコマンドの-rsオプションの指定に従って状態が変更されます。
- イベントジョブの場合,イベントジョブの実行中にエージェントが停止したときのイベントジョブの状態は,エージェントの停止状況およびイベントジョブ実行継続オプションの使用状況によって異なります。
エージェントが停止しているときにイベントジョブを実行登録すると,一定間隔でイベントジョブの開始要求が再試行されます。エージェントの,停止状況ごとのジョブの状態については,マニュアル「JP1/Automatic Job Management System 3 運用ガイド 7.2.1(4) エージェントホストを再起動する場合のマネージャーホスト上でのジョブの状態」を参照してください。
イベントジョブ実行継続オプションについては,マニュアル「JP1/Automatic Job Management System 3 運用ガイド 9.2.1 JP1/AJS3のサービスが停止してもイベントジョブの実行を継続させる」を参照してください。イベントジョブの再試行処理の詳細については,表2-3を参照してください。
- エージェントホストに複数のIPアドレスが割り当てられている場合,イベント・アクション制御マネージャーは一つのホストについて最大で四つ管理します。したがって,IPアドレスは一つのホストに対して最大四つの環境で運用してください。ホスト名から取得できるアドレス数が四つを超える場合,取得したアドレスの中から四つだけを管理しますが,どのアドレスを管理するかについては一定の規則性はありません。
- 実ホスト名がHostAであるエージェントホストに対して,HostBというエイリアスのホスト名を定義する場合,同じIPアドレスが返るように設定してください。