6.3.1 異常終了したJP1/AJS3のプロセスを再起動する
JP1/AJS3を起動すると,複数のプロセスが生成されます。JP1/AJS3 - ManagerおよびJP1/AJS3 - Agentでは,あらかじめ再起動の設定をしておくことで,何らかの理由でプロセスが異常終了した場合に自動でプロセスを再起動できます。
ここで説明する再起動の設定は,クラスタ運用ではないJP1/AJS3の再起動を目的としています。クラスタ運用の場合で再起動したいときは,クラスタソフトの制御によって再起動するようにしてください。詳細については,「10.1 クラスタシステムの概要」を参照してください。
再起動の設定は,拡張起動プロセス定義ファイルで定義します。推奨値はデフォルトです。JP1/AJS3では,障害発生時の自動回復を強化するため,再起動によって回復できるプロセスがデフォルトで設定されています(JP1/AJS2では再起動しない設定がデフォルト)。各プロセスの,再起動の設定のデフォルト値については,表6-17〜表6-22の再起動設定のデフォルト値一覧を参照してください。
設定を変更するには,拡張起動プロセス定義ファイルの編集後,JP1/BaseおよびJP1/AJS3を再起動してください。
拡張起動プロセス定義ファイルの格納先を次に示します。
- Windowsの場合
-
JP1/AJS3のインストール先フォルダ\conf
- UNIXの場合
-
/etc/opt/jp1ajs2/conf
なお,再起動したときの動作は,物理ホストと論理ホストで異なります。それぞれの再起動したときの動作を次に示します。
- 物理ホストの場合
-
拡張起動プロセス定義ファイルの定義に従って再起動します。
- 論理ホストの場合
-
- Windows
-
-HAオプションの指定にかかわらず再起動の設定が無効となり再起動しません。
- UNIX
-
JP1/AJS3 - Managerでは,jajs_start.clusterコマンドまたはjajs_spmdコマンドに-HAオプションを指定して起動すると,再起動の設定が無効となり再起動しません。
JP1/AJS3 - Agentでは,-HAオプションの指定にかかわらず再起動の設定が無効となり再起動しません。
再起動の設定対象となるプロセスを次の表に示します。再起動の設定対象となるのは,一覧にあるJP1/AJS3 - Manager,JP1/AJS3 - AgentのJP1/AJS3サービスの子プロセス,または詳細プロセスだけです。表6-10〜表6-15の再起動の設定対象となるプロセス一覧にないプロセスは,再起動を設定できません。
- Windowsの場合
-
表6‒10 再起動の設定対象となるプロセス一覧(標準構成のJP1/AJS3 - Manager) 項番
子プロセス名称または詳細プロセス名称
拡張起動プロセス定義ファイル
再起動対象プロセス
1
jajs_dbmd.exe
jp1ajs_service_0700.conf
jajs_dbmd.exeおよび詳細プロセス※
2
ajsdbmgrd.exe
jp1ajs_dbmd_0700.conf
ajsdbmgrd.exe
3
jajs_hstd.exe
jp1ajs_service_0700.conf
jajs_hstd.exeおよび詳細プロセス※
4
ajshlogd.exe
jp1ajs_hstd_0700.conf
ajshlogd.exe
5
ajsinetd.exe
jp1ajs_hstd_0700.conf
ajsinetd.exe
6
ajsnetwd.exe
jp1ajs_hstd_0700.conf
ajsnetwd.exe
7
ajsagtmd.exe
jp1ajs_hstd_0700.conf
ajsagtmd.exe
8
ajsovstatd.exe
jp1ajs_hstd_0700.conf
ajsovstatd.exe
9
ajsgwmasterd.exe
jp1ajs_hstd_0700.conf
ajsgwmasterd.exe
10
ajsqlcltd.exe
jp1ajs_hstd_0700.conf
ajsqlcltd.exe
11
jpqman.exe
jp1ajs_hstd_0700.conf
jpqman.exe
12
jpomanager.exe
jp1ajs_hstd_0700.conf
jpomanager.exe
13
ajscdinetd.exe
jp1ajs_hstd_0700.conf
ajscdinetd.exe
14
jajs_schd.exe
jp1ajs_service_0700.conf
jajs_schd.exeおよび詳細プロセス※
15
ajslogd.exe
jp1ajs_schd_0700.conf
ajslogd.exe
16
jpqman.exe
jp1ajs_schd_0700.conf
jpqman.exe
17
jpomanager.exe
jp1ajs_schd_0700.conf
jpomanager.exe
18
ajsmasterd.exe
jp1ajs_schd_0700.conf
ajsmasterd.exe
19
jajs_agtd.exe
jp1ajs_service_0700.conf
jajs_agtd.exeおよび詳細プロセス※
20
jpqmon.exe
jp1ajs_agtd_0700.conf
jpqmon.exe
21
jpoagent.exe
jp1ajs_agtd_0700.conf
jpoagent.exe
22
ajsagtmond.exe
jp1ajs_hstd_0700.conf
ajsagtmond.exe
- 注※
-
JP1/AJS3の詳細プロセスについては,マニュアル「JP1/Automatic Job Management System 3 トラブルシューティング 付録B プロセス一覧」を参照してください。
-
表6‒11 再起動の設定対象となるプロセス一覧(互換用ISAM構成のJP1/AJS3 - Manager) 項番
子プロセス名称または詳細プロセス名称
拡張起動プロセス定義ファイル
再起動対象プロセス
1
jajs_hstd.exe
jp1ajs_service_0700.conf
jajs_hstd.exeおよび詳細プロセス※
2
ajshlogd.exe
jp1ajs_hstd_0700.conf
ajshlogd.exe
3
ajsinetd.exe
jp1ajs_hstd_0700.conf
ajsinetd.exe
4
ajsnetwd.exe
jp1ajs_hstd_0700.conf
ajsnetwd.exe
5
ajsovstatd.exe
jp1ajs_hstd_0700.conf
ajsovstatd.exe
6
ajsgwmasterd.exe
jp1ajs_hstd_0700.conf
ajsgwmasterd.exe
7
ajsqlcltd.exe
jp1ajs_hstd_0700.conf
ajsqlcltd.exe
8
jpqman.exe
jp1ajs_hstd_0700.conf
jpqman.exe
9
jpomanager.exe
jp1ajs_hstd_0700.conf
jpomanager.exe
10
ajscdinetd.exe
jp1ajs_hstd_0700.conf
ajscdinetd.exe
11
ajsmasterd.exe
jp1ajs_hstd_0700.conf
ajsmasterd.exe
12
jajs_agtd.exe
jp1ajs_service_0700.conf
jajs_agtd.exeおよび詳細プロセス※
13
jpqmon.exe
jp1ajs_agtd_0700.conf
jpqmon.exe
14
jpoagent.exe
jp1ajs_agtd_0700.conf
jpoagent.exe
- 注※
-
JP1/AJS3の詳細プロセスについては,マニュアル「JP1/Automatic Job Management System 3 トラブルシューティング 付録B プロセス一覧」を参照してください。
-
表6‒12 再起動の設定対象となるプロセス一覧(JP1/AJS3 - Agent) 項番
子プロセス名称または詳細プロセス名称
拡張起動プロセス定義ファイル
再起動対象プロセス
1
ajsqlcltd.exe
jp1ajs_service_0700.conf
ajsqlcltd.exe
2
jpqmon.exe
jp1ajs_service_0700.conf
jpqmon.exe
3
jpoagent.exe
jp1ajs_service_0700.conf
jpoagent.exe
- UNIXの場合
-
表6‒13 再起動の設定対象となるプロセス一覧(標準構成のJP1/AJS3 - Manager) 項番
子プロセス名称または詳細プロセス名称
拡張起動プロセス定義ファイル
再起動対象プロセス
1
jajs_dbmd
jp1ajs_service_0700.conf
jajs_dbmdおよび詳細プロセス※1
2
ajsdbmgrd
jp1ajs_dbmd_0700.conf
ajsdbmgrd
3
jajs_hstd
jp1ajs_service_0700.conf
jajs_hstdおよび詳細プロセス※1
4
ajshlogd
jp1ajs_hstd_0700.conf
ajshlogd
5
ajsinetd
jp1ajs_hstd_0700.conf
ajsinetd
6
ajsnetwd
jp1ajs_hstd_0700.conf
ajsnetwd
7
ajsagtmd
jp1ajs_hstd_0700.conf
ajsagtmd
8
ajsovstatd
jp1ajs_hstd_0700.conf
ajsovstatd
9
ajsgwmasterd
jp1ajs_hstd_0700.conf
ajsgwmasterd
10
jpqman※2
jp1ajs_hstd_0700.conf
jpqman※2
11
jpomanager
jp1ajs_hstd_0700.conf
jpomanager
12
ajscdinetd
jp1ajs_hstd_0700.conf
ajscdinetd
13
jajs_schd
jp1ajs_service_0700.conf
jajs_schdおよび詳細プロセス※1
14
ajslogd
jp1ajs_schd_0700.conf
ajslogd
15
jpqman
jp1ajs_schd_0700.conf
jpqman
16
jpomanager
jp1ajs_schd_0700.conf
jpomanager
17
ajsmasterd
jp1ajs_schd_0700.conf
ajsmasterd
18
jajs_agtd
jp1ajs_service_0700.conf
jajs_agtdおよび詳細プロセス※1
19
jpqmon
jp1ajs_agtd_0700.conf
jpqmon
20
jpoagent
jp1ajs_agtd_0700.conf
jpoagent
21
ajsagtmond
jp1ajs_hstd_0700.conf
ajsagtmond
- 注※1
-
JP1/AJS3の詳細プロセスについては,マニュアル「JP1/Automatic Job Management System 3 トラブルシューティング 付録B プロセス一覧」を参照してください。
- 注※2
-
HP-UX,AIX,およびLinuxの場合,詳細プロセス名は「jpqman32」です。
-
表6‒14 再起動の設定対象となるプロセス一覧(互換用ISAM構成のJP1/AJS3 - Manager) 項番
子プロセス名称または詳細プロセス名称
拡張起動プロセス定義ファイル
再起動対象プロセス
1
jajs_hstd
jp1ajs_service_0700.conf
jajs_hstdおよび詳細プロセス※
2
ajshlogd
jp1ajs_hstd_0700.conf
ajshlogd
3
ajsinetd
jp1ajs_hstd_0700.conf
ajsinetd
4
ajsnetwd
jp1ajs_hstd_0700.conf
ajsnetwd
5
ajsovstatd
jp1ajs_hstd_0700.conf
ajsovstatd
6
ajsgwmasterd
jp1ajs_hstd_0700.conf
ajsgwmasterd
7
jpqman
jp1ajs_hstd_0700.conf
jpqman
8
jpomanager
jp1ajs_hstd_0700.conf
jpomanager
9
ajscdinetd
jp1ajs_hstd_0700.conf
ajscdinetd
10
ajsmasterd
jp1ajs_hstd_0700.conf
ajsmasterd
11
jajs_agtd
jp1ajs_service_0700.conf
jajs_agtdおよび詳細プロセス※
12
jpqmon
jp1ajs_agtd_0700.conf
jpqmon
13
jpoagent
jp1ajs_agtd_0700.conf
jpoagent
- 注※
-
JP1/AJS3の詳細プロセスについては,マニュアル「JP1/Automatic Job Management System 3 トラブルシューティング 付録B プロセス一覧」を参照してください。
-
表6‒15 再起動の設定対象となるプロセス一覧(JP1/AJS3 - Agent) 項番
子プロセス名称または詳細プロセス名称
拡張起動プロセス定義ファイル
再起動対象プロセス
1
jpqmon
jp1ajs_service_0700.conf
jpqmon
2
jpoagent
jp1ajs_service_0700.conf
jpoagent
定義ファイルの形式を次に示します。
- JP1/AJS3 - Managerの場合
-
プロセス名|パス|起動オプション|再起動可否|再起動回数|リトライ間隔|再起動回数リセット時間|種別|スケジューラーフラグ|起動順序|自動起動|停止パス|停止オプション|状態確認パス|状態確認オプション|状態確認終了コード|状態確認間隔|
- JP1/AJS3 - Agentの場合
-
プロセス名|パス|起動オプション|再起動可否|再起動回数|リトライ間隔|再起動回数リセット時間|
定義ファイルには,あらかじめ定義情報が記載されています。「再起動可否」,「再起動回数」,「リトライ間隔」,および「再起動回数リセット時間」は変更できますが,それ以外のフィールドはシステムが使用するので変更しないでください。また,フィールドを区切っている「|」は省略できません。コメント文を挿入したい場合は,行頭に「#」を付けてください。改行されるまでがコメント文です。
変更できるフィールドに指定できる値を次の表に示します。
フィールド名 |
内容 |
---|---|
再起動可否 |
プロセスが異常終了した場合に,再起動するかどうかを指定します。再起動しない場合は0,再起動する場合は1を指定します。デフォルトとして,あらかじめ最適値が設定されています。 |
再起動回数 |
プロセスの再起動の試行回数を指定します。指定できる値は,0〜99です。各プロセスで,あらかじめ最適値が設定されています。運用方法に応じてカスタマイズしてください。再起動可否のフィールドに0が指定されている場合は,値が指定されていても無効です。 |
リトライ間隔 |
プロセスの再起動のリトライ間隔を秒単位で指定します。指定できる値は,0〜3,600です。各プロセスで,あらかじめ最適値が設定されています。運用方法に応じてカスタマイズしてください。再起動可否のフィールドに0が指定されている場合は,値が指定されていても無効です。 |
再起動回数リセット時間 |
再起動によってプロセスが起動してから,何時間後に再起動回数をリセットするかを秒単位で指定します。プロセスが起動してから,指定した時間が経過すると,再起動回数がリセットされます。再度プロセスが異常終了した場合は,再起動回数が1からカウントされます。 再起動によってプロセスが起動してから,指定した時間より前に再度異常終了した場合は,前回の再起動回数を引き継ぎます。指定できる値は,3,600〜2,147,483,647(秒)です。各プロセスで,あらかじめ最適値が設定されています。運用方法に応じてカスタマイズしてください。再起動可否のフィールドに0が指定されている場合は,値が指定されていても無効です。 |
- 注意事項
-
-
設定を省略したり,正常値を設定していない状態でプロセスを起動したりすると,エラーとなり起動しません。
-
クラスタ構成では,論理ホストのプロセス管理のプロセスを起動する際,論理ホストのconfフォルダに拡張起動プロセス定義ファイルがない場合,物理ホストの拡張起動プロセス定義ファイルがコピーされます。
-
子プロセスajsmasterdが再起動した場合,再起動前に実行中であったジョブネットおよびジョブは中断されます。ajsmasterdの再起動後のジョブネットおよびジョブの状態は,JP1/AJS3サービスの起動モードによって異なります。サービス起動モードによるジョブネットおよびジョブの状態の詳細については,「6.2.1(3) 起動モード別のジョブネットおよびジョブの状態」を参照してください。
-
再起動時,統合トレースログに「KNAD3737-E コンポーネント名の管理対象プロセス名は異常終了しました」というメッセージが出力される場合があります。要因は,異常終了したプロセスを再起動するまでの間隔が短いため,異常終了したプロセスが配下の子プロセスも含めて完全に停止する前に再起動の動作が開始し,二重起動が検知されるためです。再起動回数内であれば,起動できるまで自動的に再起動を試みるため問題ありませんが,拡張起動プロセス定義ファイルのリトライ間隔を延ばすことによって,エラーメッセージKNAD3737-Eの出力を回避できます。また,マシン性能が低い場合,この現象が発生する可能性が高くなるため,必要に応じてリトライ間隔をカスタマイズしてください。
なお,リトライ間隔を長くすることによって,逆にJP1/AJS3サービスの再起動までの時間が長くなることがあります。そのため,リトライ間隔に大きい値を設定しないでください。変更する場合の推奨値は10秒です。
-
JP1/AJS3の子プロセスが再起動した場合,その詳細プロセスも再起動し,詳細プロセスの再起動回数のカウントはリセットされます。
-
再起動設定のデフォルト値を次の表に示します。
- Windowsの場合
-
表6‒17 再起動設定のデフォルト値一覧(標準構成のJP1/AJS3 - Manager) 項番
子プロセス名称または詳細プロセス名称
再起動可否
再起動回数
リトライ間隔
再起動回数リセット時間
1
jajs_dbmd.exe
する
3
3
21600
2
ajsdbmgrd.exe
しない
3
3
21600
3
jajs_hstd.exe
する
3
20
21600
4
ajshlogd.exe
する
3
3
21600
5
ajsinetd.exe
する
3
3
21600
6
ajsnetwd.exe
する
3
3
21600
7
ajsagtmd.exe
する
3
3
21600
8
ajsovstatd.exe
する
3
3
21600
9
ajsgwmasterd.exe
する
3
3
21600
10
ajsqlcltd.exe
する
3
3
21600
11
jpqman.exe
する
3
3
21600
12
jpomanager.exe
する
3
3
21600
13
ajscdinetd.exe
する
3
3
21600
14
ajsagtmond.exe
する
3
3
21600
15
jajs_schd.exe
する
3
10
21600
16
ajslogd.exe
しない
3
3
21600
17
jpqman.exe
しない
3
3
21600
18
jpomanager.exe
しない
3
3
21600
19
ajsmasterd.exe
しない
3
3
21600
20
jajs_agtd.exe
する
3
3
21600
21
jpqmon.exe
する
3
3
21600
22
jpoagent.exe
する
3
3
21600
表6‒18 再起動設定のデフォルト値一覧(互換用ISAM構成のJP1/AJS3 - Manager) 項番
子プロセス名称または詳細プロセス名称
再起動可否
再起動回数
リトライ間隔
再起動回数リセット時間
1
jajs_hstd.exe
する
3
20
21600
2
ajshlogd.exe
する
3
3
21600
3
ajsinetd.exe
する
3
3
21600
4
ajsnetwd.exe
する
3
3
21600
5
ajsovstatd.exe
する
3
3
21600
6
ajsgwmasterd.exe
する
3
3
21600
7
ajsqlcltd.exe
する
3
3
21600
8
jpqman.exe
する
3
3
21600
9
jpomanager.exe
する
3
3
21600
10
ajscdinetd.exe
する
3
3
21600
11
ajsmasterd.exe
しない
3
3
21600
12
jajs_agtd.exe
する
3
3
21600
13
jpqmon.exe
する
3
3
21600
14
jpoagent.exe
する
3
3
21600
表6‒19 再起動設定のデフォルト値一覧(JP1/AJS3 - Agent) 項番
子プロセス名称または詳細プロセス名称
再起動可否
再起動回数
リトライ間隔
再起動回数リセット時間
1
ajsqlcltd.exe
する
3
3
21600
2
jpqmon.exe
する
3
3
21600
3
jpoagent.exe
する
3
3
21600
- UNIXの場合
-
表6‒20 再起動設定のデフォルト値一覧(標準構成のJP1/AJS3 - Manager) 項番
子プロセス名称または詳細プロセス名称
再起動可否
再起動回数
リトライ間隔
再起動回数リセット時間
1
jajs_dbmd※1
する※2
3
3
21600
2
ajsdbmgrd
しない
3
3
21600
3
jajs_hstd
する※2
3
20
21600
4
ajshlogd
する※2
3
3
21600
5
ajsinetd
する※2
3
3
21600
6
ajsnetwd
する※2
3
3
21600
7
ajsagtmd
する※2
3
3
21600
8
ajsovstatd
する※2
3
3
21600
9
ajsgwmasterd
する※2
3
3
21600
10
jpqman※3
する
3
3
21600
11
jpomanager
する
3
3
21600
12
ajscdinetd
する※2
3
3
21600
13
ajsagtmond
する
3
3
21600
14
jajs_schd※1
する※2
3
10
21600
15
ajslogd
しない
3
3
21600
16
jpqman
しない
3
3
21600
17
jpomanager
しない
3
3
21600
18
ajsmasterd
しない
3
3
21600
19
jajs_agtd※1
する※2
3
3
21600
20
jpqmon
する
3
3
21600
21
jpoagent
する
3
3
21600
- 注※1
-
論理ホストの場合,jajs_dbmd配下,jajs_schd配下およびjajs_agtd配下の詳細プロセスは,個別に再起動を設定する必要はありません。親プロセスの再起動によって,詳細プロセスも再起動します。
- 注※2
-
論理ホストの場合,デフォルト値では再起動しない設定になっています。
- 注※3
-
HP-UX,AIX,およびLinuxの場合,詳細プロセス名は「jpqman32」です。
表6‒21 再起動設定のデフォルト値一覧(互換用ISAM構成のJP1/AJS3 - Manager) 項番
子プロセス名称または詳細プロセス名称
再起動可否
再起動回数
リトライ間隔
再起動回数リセット時間
1
jajs_hstd
する※1
3
20
21600
2
ajshlogd
する※1
3
3
21600
3
ajsinetd
する※1
3
3
21600
4
ajsnetwd
する※1
3
3
21600
5
ajsovstatd
する※1
3
3
21600
6
ajsgwmasterd
する※1
3
3
21600
7
jpqman
する※1
3
3
21600
8
jpomanager
する※1
3
3
21600
9
ajscdinetd
する※1
3
3
21600
10
ajsmasterd
しない
3
3
21600
11
jajs_agtd※2
する※1
3
3
21600
12
jpqmon
する
3
3
21600
13
jpoagent
する
3
3
21600
- 注※1
-
論理ホストの場合,デフォルト値では再起動しない設定になっています。
- 注※2
-
論理ホストの場合,jajs_agtd配下の詳細プロセスは,個別に再起動を設定する必要はありません。親プロセスの再起動によって,詳細プロセスも再起動します。
表6‒22 再起動設定のデフォルト値一覧(JP1/AJS3 - Agent) 項番
子プロセス名称または詳細プロセス名称
再起動可否
再起動回数
リトライ間隔
再起動回数リセット時間
1
jpqmon
する
3
3
21600
2
jpoagent
する
3
3
21600
再起動の設定のデフォルト値は,各プロセスの特性を考慮し,あらかじめ最適な値を設定しています。各プロセスの特性について次に示します。
-
jajs_hstd.exeおよびjajs_hstdは,管理するプロセス数が多く,停止処理に時間を要するプロセスを管理しているため,リトライ間隔を長く設定しています。
-
jajs_schd.exeおよびjajs_schdは,停止処理に時間を要するプロセスを管理しているため,リトライ間隔を長く設定しています。
-
jajs_schd.exeおよびjajs_schdの詳細プロセスは,詳細プロセス間で同期して起動する必要があるため,一部の詳細プロセスだけを再起動できません。一部の詳細プロセスが異常終了した場合は,jajs_schd.exeおよびjajs_schdが再起動するように設定されています。詳細プロセスが個別に再起動するように設定する必要はありません。
-
互換用ISAM構成のajsmasterd.exeおよびajsmasterdは,ajsmasterd自身が再起動の機能を持っているため,JP1/AJS3からの再起動は不要です。
-
ajsdbmgrd.exeおよびajsdbmgrdが異常終了した場合は,jajs_dbmd.exeおよびjajs_dbmdが再起動するように設定されています。ajsdbmgrd.exeおよびajsdbmgrdが個別に再起動するように設定する必要はありません。
-
物理ホストの場合,jajs_agtd.exeおよびjajs_agtdの詳細プロセスの異常終了回数が再起動回数の設定値を超えると,jajs_agtd.exeおよびjajs_agtdは停止します。そのあと,jajs_agtd.exeおよびjajs_agtdは再起動可否の設定に従って再起動します。
-
UNIX版のJP1/AJS3 - Managerで論理ホストの場合,jajs_agtdの詳細プロセスは再起動プロセスの対象外になります。ただし,親プロセスであるjajs_agtdが再起動すると,詳細プロセスも再起動します。
- 〈この項の構成〉
(1) 設定例
拡張起動プロセス定義ファイルの設定例と,プロセスが異常終了した場合の動作を次に示します。
ここでは,JP1/AJS3の子プロセスに対して次の条件を設定します。
再起動可否:する 再起動回数:4回 リトライ間隔:3秒 再起動回数リセット時間:3,600秒
|
プロセスが異常終了した場合の動作例を次の図に示します。
|
図の例では,再起動後,再起動回数のリセット時間で指定した3,600秒以内に異常終了しなかった場合,3,600秒の時点で再起動回数がリセットされます。次回異常終了したときには1回目からカウントされます。一方,再起動後,3,600秒以内に異常終了した場合は,再起動回数を引き継ぎます。再起動回数が,指定した回数に達すると,次回異常終了時には再起動しません。