Hitachi

JP1 Version 12 JP1/Automatic Job Management System 3 運用ガイド


6.3.1 異常終了したJP1/AJS3のプロセスを再起動する

JP1/AJS3を起動すると,複数のプロセスが生成されます。JP1/AJS3 - ManagerおよびJP1/AJS3 - Agentでは,あらかじめ再起動の設定をしておくことで,何らかの理由でプロセスが異常終了した場合に自動でプロセスを再起動できます。

ここで説明する再起動の設定は,クラスタ運用ではないJP1/AJS3の再起動を目的としています。クラスタ運用の場合で再起動したいときは,クラスタソフトの制御によって再起動するようにしてください。詳細については,「10.1 クラスタシステムの概要」を参照してください。

再起動の設定は,拡張起動プロセス定義ファイルで定義します。推奨値はデフォルトです。JP1/AJS3では,障害発生時の自動回復を強化するため,再起動によって回復できるプロセスがデフォルトで設定されています(JP1/AJS2では再起動しない設定がデフォルト)。各プロセスの,再起動の設定のデフォルト値については,表6-15表6-18の再起動設定のデフォルト値一覧を参照してください。

設定を変更するには,拡張起動プロセス定義ファイルの編集後,JP1/BaseおよびJP1/AJS3を再起動してください。

拡張起動プロセス定義ファイルの格納先を次に示します。

Windowsの場合

JP1/AJS3のインストール先フォルダ\conf

UNIXの場合

/etc/opt/jp1ajs2/conf

なお,再起動したときの動作は,物理ホストと論理ホストで異なります。それぞれの再起動したときの動作を次に示します。

物理ホストの場合

拡張起動プロセス定義ファイルの定義に従って再起動します。

論理ホストの場合
Windows

-HAオプションの指定にかかわらず再起動の設定が無効となり再起動しません。

UNIX

JP1/AJS3 - Managerでは,jajs_start.clusterコマンドまたはjajs_spmdコマンドに-HAオプションを指定して起動すると,再起動の設定が無効となり再起動しません。

JP1/AJS3 - Agentでは,-HAオプションの指定にかかわらず再起動の設定が無効となり再起動しません。

再起動の設定対象となるプロセスを次の表に示します。再起動の設定対象となるのは,一覧にあるJP1/AJS3 - Manager,JP1/AJS3 - AgentのJP1/AJS3サービスの子プロセス,または詳細プロセスだけです。表6-10表6-13の再起動の設定対象となるプロセス一覧にないプロセスは,再起動を設定できません。

Windowsの場合
表6‒10 再起動の設定対象となるプロセス一覧(JP1/AJS3 - Manager)

項番

子プロセス名称または詳細プロセス名称

拡張起動プロセス定義ファイル

再起動対象プロセス

1

jajs_dbmd.exe

jp1ajs_service_0700.conf

jajs_dbmd.exeおよび詳細プロセス

2

ajsdbmgrd.exe

jp1ajs_dbmd_0700.conf

ajsdbmgrd.exe

3

jajs_hstd.exe

jp1ajs_service_0700.conf

jajs_hstd.exeおよび詳細プロセス

4

ajshlogd.exe

jp1ajs_hstd_0700.conf

ajshlogd.exe

5

ajsinetd.exe

jp1ajs_hstd_0700.conf

ajsinetd.exe

6

ajsnetwd.exe

jp1ajs_hstd_0700.conf

ajsnetwd.exe

7

ajsagtmd.exe

jp1ajs_hstd_0700.conf

ajsagtmd.exe

8

ajsovstatd.exe

jp1ajs_hstd_0700.conf

ajsovstatd.exe

9

ajsgwmasterd.exe

jp1ajs_hstd_0700.conf

ajsgwmasterd.exe

10

ajsqlcltd.exe

jp1ajs_hstd_0700.conf

ajsqlcltd.exe

11

jpqman.exe

jp1ajs_hstd_0700.conf

jpqman.exe

12

jpomanager.exe

jp1ajs_hstd_0700.conf

jpomanager.exe

13

ajscdinetd.exe

jp1ajs_hstd_0700.conf

ajscdinetd.exe

14

jajs_schd.exe

jp1ajs_service_0700.conf

jajs_schd.exeおよび詳細プロセス

15

ajslogd.exe

jp1ajs_schd_0700.conf

ajslogd.exe

16

jpqman.exe

jp1ajs_schd_0700.conf

jpqman.exe

17

jpomanager.exe

jp1ajs_schd_0700.conf

jpomanager.exe

18

ajsmasterd.exe

jp1ajs_schd_0700.conf

ajsmasterd.exe

19

jajs_agtd.exe

jp1ajs_service_0700.conf

jajs_agtd.exeおよび詳細プロセス

20

jpqmon.exe

jp1ajs_agtd_0700.conf

jpqmon.exe

21

jpoagent.exe

jp1ajs_agtd_0700.conf

jpoagent.exe

22

ajsagtmond.exe

jp1ajs_hstd_0700.conf

ajsagtmond.exe

注※

JP1/AJS3の詳細プロセスについては,マニュアル「JP1/Automatic Job Management System 3 トラブルシューティング 付録B プロセス一覧」を参照してください。

表6‒11 再起動の設定対象となるプロセス一覧(JP1/AJS3 - Agent)

項番

子プロセス名称または詳細プロセス名称

拡張起動プロセス定義ファイル

再起動対象プロセス

1

ajsqlcltd.exe

jp1ajs_service_0700.conf

ajsqlcltd.exe

2

jpqmon.exe

jp1ajs_service_0700.conf

jpqmon.exe

3

jpoagent.exe

jp1ajs_service_0700.conf

jpoagent.exe

UNIXの場合
表6‒12 再起動の設定対象となるプロセス一覧(JP1/AJS3 - Manager)

項番

子プロセス名称または詳細プロセス名称

拡張起動プロセス定義ファイル

再起動対象プロセス

1

jajs_dbmd

jp1ajs_service_0700.conf

jajs_dbmdおよび詳細プロセス※1

2

ajsdbmgrd

jp1ajs_dbmd_0700.conf

ajsdbmgrd

3

jajs_hstd

jp1ajs_service_0700.conf

jajs_hstdおよび詳細プロセス※1

4

ajshlogd

jp1ajs_hstd_0700.conf

ajshlogd

5

ajsinetd

jp1ajs_hstd_0700.conf

ajsinetd

6

ajsnetwd

jp1ajs_hstd_0700.conf

ajsnetwd

7

ajsagtmd

jp1ajs_hstd_0700.conf

ajsagtmd

8

ajsovstatd

jp1ajs_hstd_0700.conf

ajsovstatd

9

ajsgwmasterd

jp1ajs_hstd_0700.conf

ajsgwmasterd

10

jpqman※2

jp1ajs_hstd_0700.conf

jpqman※2

11

jpomanager

jp1ajs_hstd_0700.conf

jpomanager

12

ajscdinetd

jp1ajs_hstd_0700.conf

ajscdinetd

13

jajs_schd

jp1ajs_service_0700.conf

jajs_schdおよび詳細プロセス※1

14

ajslogd

jp1ajs_schd_0700.conf

ajslogd

15

jpqman

jp1ajs_schd_0700.conf

jpqman

16

jpomanager

jp1ajs_schd_0700.conf

jpomanager

17

ajsmasterd

jp1ajs_schd_0700.conf

ajsmasterd

18

jajs_agtd

jp1ajs_service_0700.conf

jajs_agtdおよび詳細プロセス※1

19

jpqmon

jp1ajs_agtd_0700.conf

jpqmon

20

jpoagent

jp1ajs_agtd_0700.conf

jpoagent

21

ajsagtmond

jp1ajs_hstd_0700.conf

ajsagtmond

注※1

JP1/AJS3の詳細プロセスについては,マニュアル「JP1/Automatic Job Management System 3 トラブルシューティング 付録B プロセス一覧」を参照してください。

注※2

HP-UX,AIX,およびLinuxの場合,詳細プロセス名は「jpqman32」です。

表6‒13 再起動の設定対象となるプロセス一覧(JP1/AJS3 - Agent)

項番

子プロセス名称または詳細プロセス名称

拡張起動プロセス定義ファイル

再起動対象プロセス

1

jpqmon

jp1ajs_service_0700.conf

jpqmon

2

jpoagent

jp1ajs_service_0700.conf

jpoagent

定義ファイルの形式を次に示します。

JP1/AJS3 - Managerの場合

プロセス名|パス|起動オプション|再起動可否|再起動回数|リトライ間隔|再起動回数リセット時間|種別|スケジューラーフラグ|起動順序|自動起動|停止パス|停止オプション|状態確認パス|状態確認オプション|状態確認終了コード|状態確認間隔|

JP1/AJS3 - Agentの場合

プロセス名|パス|起動オプション|再起動可否|再起動回数|リトライ間隔|再起動回数リセット時間|

定義ファイルには,あらかじめ定義情報が記載されています。「再起動可否」,「再起動回数」,「リトライ間隔」,および「再起動回数リセット時間」は変更できますが,それ以外のフィールドはシステムが使用するので変更しないでください。また,フィールドを区切っている「|」は省略できません。コメント文を挿入したい場合は,行頭に「#」を付けてください。改行されるまでがコメント文です。

変更できるフィールドに指定できる値を次の表に示します。

表6‒14 変更できるフィールドに指定できる値

フィールド名

内容

再起動可否

プロセスが異常終了した場合に,再起動するかどうかを指定します。再起動しない場合は0,再起動する場合は1を指定します。デフォルトとして,あらかじめ最適値が設定されています。

再起動回数

プロセスの再起動の試行回数を指定します。指定できる値は,0〜99です。各プロセスで,あらかじめ最適値が設定されています。運用方法に応じてカスタマイズしてください。再起動可否のフィールドに0が指定されている場合は,値が指定されていても無効です。

リトライ間隔

プロセスの再起動のリトライ間隔を秒単位で指定します。指定できる値は,0〜3,600です。各プロセスで,あらかじめ最適値が設定されています。運用方法に応じてカスタマイズしてください。再起動可否のフィールドに0が指定されている場合は,値が指定されていても無効です。

再起動回数リセット時間

再起動によってプロセスが起動してから,何時間後に再起動回数をリセットするかを秒単位で指定します。プロセスが起動してから,指定した時間が経過すると,再起動回数がリセットされます。再度プロセスが異常終了した場合は,再起動回数が1からカウントされます。

再起動によってプロセスが起動してから,指定した時間より前に再度異常終了した場合は,前回の再起動回数を引き継ぎます。指定できる値は,3,600〜2,147,483,647(秒)です。各プロセスで,あらかじめ最適値が設定されています。運用方法に応じてカスタマイズしてください。再起動可否のフィールドに0が指定されている場合は,値が指定されていても無効です。

注意事項
  • 設定を省略したり,正常値を設定していない状態でプロセスを起動したりすると,エラーとなり起動しません。

  • クラスタ構成では,論理ホストのプロセス管理のプロセスを起動する際,論理ホストのconfフォルダに拡張起動プロセス定義ファイルがない場合,物理ホストの拡張起動プロセス定義ファイルがコピーされます。

  • 子プロセスajsmasterdが再起動した場合,再起動後のジョブネットおよびジョブの状態は,JP1/AJS3サービスの起動モードによって異なります。サービス起動モードによるジョブネットおよびジョブの状態の詳細については,「6.2.1(3) 起動モード別のジョブネットおよびジョブの状態」を参照してください。

  • 再起動時,統合トレースログに「KNAD3737-E コンポーネント名管理対象プロセス名は異常終了しました」というメッセージが出力される場合があります。要因は,異常終了したプロセスを再起動するまでの間隔が短く,異常終了したプロセスが配下の子プロセスも含めて完全に停止する前に再起動の動作が開始し,二重起動が検知されるためです。再起動回数内であれば,起動できるまで自動的に再起動を試みるため問題ありません。ただし,拡張起動プロセス定義ファイルのリトライ間隔を延ばすことによって,エラーメッセージKNAD3737-Eの出力を回避できます。また,マシン性能が低い場合,この現象が発生しやすくなるおそれがあるため,必要に応じてリトライ間隔をカスタマイズしてください。

    なお,リトライ間隔を長くすることによって,逆にJP1/AJS3サービスの再起動までの時間が長くなることがあります。そのため,リトライ間隔に大きい値を設定しないでください。変更する場合の推奨値は10秒です。

  • JP1/AJS3の子プロセスが再起動した場合,その詳細プロセスも再起動し,詳細プロセスの再起動回数のカウントはリセットされます。

再起動設定のデフォルト値を次の表に示します。

Windowsの場合
表6‒15 再起動設定のデフォルト値一覧(JP1/AJS3 - Manager)

項番

子プロセス名称または詳細プロセス名称

再起動可否

再起動回数

リトライ間隔

再起動回数リセット時間

1

jajs_dbmd.exe

する

3

3

21600

2

ajsdbmgrd.exe

しない

3

3

21600

3

jajs_hstd.exe

する

3

20

21600

4

ajshlogd.exe

する

3

3

21600

5

ajsinetd.exe

する

3

3

21600

6

ajsnetwd.exe

する

3

3

21600

7

ajsagtmd.exe

する

3

3

21600

8

ajsovstatd.exe

する

3

3

21600

9

ajsgwmasterd.exe

する

3

3

21600

10

ajsqlcltd.exe

する

3

3

21600

11

jpqman.exe

する

3

3

21600

12

jpomanager.exe

する

3

3

21600

13

ajscdinetd.exe

する

3

3

21600

14

ajsagtmond.exe

する

3

3

21600

15

jajs_schd.exe

する

3

10

21600

16

ajslogd.exe

しない

3

3

21600

17

jpqman.exe

しない

3

3

21600

18

jpomanager.exe

しない

3

3

21600

19

ajsmasterd.exe

しない

3

3

21600

20

jajs_agtd.exe

する

3

3

21600

21

jpqmon.exe

する

3

3

21600

22

jpoagent.exe

する

3

3

21600

表6‒16 再起動設定のデフォルト値一覧(JP1/AJS3 - Agent)

項番

子プロセス名称または詳細プロセス名称

再起動可否

再起動回数

リトライ間隔

再起動回数リセット時間

1

ajsqlcltd.exe

する

3

3

21600

2

jpqmon.exe

する

3

3

21600

3

jpoagent.exe

する

3

3

21600

UNIXの場合
表6‒17 再起動設定のデフォルト値一覧(JP1/AJS3 - Manager)

項番

子プロセス名称または詳細プロセス名称

再起動可否

再起動回数

リトライ間隔

再起動回数リセット時間

1

jajs_dbmd※1

する※2

3

3

21600

2

ajsdbmgrd

しない

3

3

21600

3

jajs_hstd

する※2

3

20

21600

4

ajshlogd

する※2

3

3

21600

5

ajsinetd

する※2

3

3

21600

6

ajsnetwd

する※2

3

3

21600

7

ajsagtmd

する※2

3

3

21600

8

ajsovstatd

する※2

3

3

21600

9

ajsgwmasterd

する※2

3

3

21600

10

jpqman※3

する

3

3

21600

11

jpomanager

する

3

3

21600

12

ajscdinetd

する※2

3

3

21600

13

ajsagtmond

する

3

3

21600

14

jajs_schd※1

する※2

3

10

21600

15

ajslogd

しない

3

3

21600

16

jpqman

しない

3

3

21600

17

jpomanager

しない

3

3

21600

18

ajsmasterd

しない

3

3

21600

19

jajs_agtd※1

する※2

3

3

21600

20

jpqmon

する

3

3

21600

21

jpoagent

する

3

3

21600

注※1

論理ホストの場合,jajs_dbmd配下,jajs_schd配下およびjajs_agtd配下の詳細プロセスは,個別に再起動を設定する必要はありません。親プロセスの再起動によって,詳細プロセスも再起動します。

注※2

論理ホストの場合,デフォルト値では再起動しない設定になっています。

注※3

HP-UX,AIX,およびLinuxの場合,詳細プロセス名は「jpqman32」です。

表6‒18 再起動設定のデフォルト値一覧(JP1/AJS3 - Agent)

項番

子プロセス名称または詳細プロセス名称

再起動可否

再起動回数

リトライ間隔

再起動回数リセット時間

1

jpqmon

する

3

3

21600

2

jpoagent

する

3

3

21600

再起動の設定のデフォルト値は,各プロセスの特性を考慮し,あらかじめ最適な値を設定しています。各プロセスの特性について次に示します。

〈この項の構成〉

(1) 設定例

拡張起動プロセス定義ファイルの設定例と,プロセスが異常終了した場合の動作を次に示します。

ここでは,JP1/AJS3の子プロセスに対して次の条件を設定します。

再起動可否:する
再起動回数:4回
リトライ間隔:3秒
再起動回数リセット時間:3,600秒
図6‒1 拡張起動プロセス定義ファイルの設定例

[図データ]

プロセスが異常終了した場合の動作例を次の図に示します。

図6‒2 プロセスが異常終了した場合の動作例

[図データ]

図の例では,再起動後,再起動回数のリセット時間で指定した3,600秒以内に異常終了しなかった場合,3,600秒の時点で再起動回数がリセットされます。次回異常終了したときには1回目からカウントされます。一方,再起動後,3,600秒以内に異常終了した場合は,再起動回数を引き継ぎます。再起動回数が,指定した回数に達すると,次回異常終了時には再起動しません。