Hitachi

JP1 Version 10 JP1/Integrated Management - Manager 導入・設計ガイド


7.1.1 プロセス異常終了時の再起動

JP1/IM - Managerは,各機能のプロセスが異常終了したときに,自動的に再起動することによって,回復を試みることができます。

JP1/IMのプロセスは,プロセス管理機能によって制御されており,プロセスが異常終了するとプロセス管理機能が検知し,自動的にプロセスの再起動処理をします。一時的な障害によってJP1/IM - Managerが停止した場合は,再起動によって自動的に復旧できる場合があります。

プロセス再起動は,インストール時点では有効になっていません。有効にするには,拡張起動プロセス定義ファイル(jp1co_service.conf)で「再起動可否」の項目を有効に設定します。

プロセス再起動の動作を,例として,jcamainプロセス(アクション実行サービス)の拡張起動プロセス定義ファイルの設定で説明します。なお,定義ファイルの詳細については,マニュアル「JP1/Integrated Management - Manager コマンド・定義ファイルリファレンス」の「拡張起動プロセス定義ファイル(jp1co_service.conf)」(2. 定義ファイル)を参照してください。

設定例

jcamain||1|3|3|3600|

設定の意味

プロセス名:jcamain

再起動可否:1(再起動する。 デフォルトの0:再起動しない,から変更)

再起動回数:3回 (デフォルトのまま)

リトライ間隔:3秒 (デフォルトのまま)

再起動回数リセット時間:3,600秒 (デフォルトのまま)

定義は再起動可否だけを変更しています。ほかの値は,デフォルトで適切な値が指定されており,通常は変更しません。この設定の場合,次のように動作します。

図7‒1 プロセスが異常終了した場合の動作例

[図データ]

図の例では,プロセスが再起動したあと,再起動回数リセット時間で指定した3,600秒以内に異常終了しなかった場合は,再起動回数がリセットされます。次回異常終了したときには1回目からカウントされます。一方,再起動後,3,600秒以内に異常終了した場合は,再起動回数が加算されます。再起動回数が,指定した回数に達すると,それ以降は再起動をしません。

なお,Windowsの場合は,プロセスがアプリケーションエラーになると,ワトソン博士のダイアログボックスやMicrosoftへのエラー報告のダイアログボックス(Windows Server 2003限定)が表示されます。これらが表示されると入力待ちとなって再起動ができないため,画面表示によるエラーの通知を抑止する必要があります。

注意事項

異常終了時の再起動設定は,クラスタ運用時には設定しないでください。JP1/IM - Managerの障害時にはプロセス再起動の機能も障害の影響を受けるおそれがあります。クラスタ運用時に再起動をしたい場合は,より確実に再起動を制御するためにJP1/IM - Manager外部のクラスタソフトから再起動を制御してください。