JP1/Integrated Management - Manager システム構築・運用ガイド
JP1/IM - Managerのプロセス管理機能は,JP1/IM - Managerで提供する各機能の起動や停止を制御する基盤機能です。また,各機能の動作状態を確認する場合の指示もプロセス管理機能によって制御されています。
JP1/IM - Managerは次のような機能によって構成されています。これらの機能のプロセスを,プロセス管理機能が制御しています。
- イベントコンソールサービス(evtcon)
- イベントフロー制御サービス(evflow)
- 自動アクションサービス(jcamain)
- 相関イベント発行サービス(evgen)※
- セントラルスコープサービス(jcsmain)※
- インシデント登録サービス(jcdmain)※
注※ デフォルトでは起動しません。なお,インシデント登録サービスは,JP1/IM - Incident Master連携用の機能です。
プロセス管理機能のコマンドには次のものがあります。
表3-30 プロセス管理機能のコマンド
機能 コマンド 説明 JP1/IM - Managerの起動※
(UNIX限定)jco_start JP1/IM - Managerの起動・停止を制御するコマンドです。 JP1/IM - Managerの停止※
(UNIX限定)jco_stop JP1/IM - Managerの動作確認 jco_spmd_status JP1/IM - Managerの動作状態を確認します。 JP1/IM - Managerの定義情報の再読み込み jco_spmd_reload JP1/IM - Managerの定義情報を変更したときに,変更内容を読み込んで有効にします。 注※ Windowsの場合,Windowsのサービスを使って起動・停止します。登録名はJP1/Consoleです。これにより,JP1/IM - Managerの起動・停止ができます。
表中のコマンドについては,マニュアル「JP1/Integrated Management - Manager リファレンス 2. コマンド」を参照してください。
なお,JP1/IM - Managerのプロセス管理機能は,起動,終了に関する異常を検知,対処するために以下の機能を提供しています。
- プロセスが異常終了した場合に自動で再起動する機能
- プロセスの起動・終了処理で異常を検知した場合にJP1イベントを発行する機能
これら機能の詳細については,次の「3.7.1(1)プロセス異常終了時の再起動」「3.7.1(2)プロセス異常検知時のJP1イベントの発行」を参照してください。
- <この項の構成>
- (1) プロセス異常終了時の再起動
- (2) プロセス異常検知時のJP1イベントの発行
(1) プロセス異常終了時の再起動
JP1/IM - Managerは,各機能のプロセスが異常終了したときに,自動的に再起動することによって,回復を試みることができます。
JP1/IMのプロセスは,プロセス管理機能によって制御されており,プロセスが異常終了するとプロセス管理機能が検知し,自動的にプロセスの再起動処理をします。一時的な障害によってJP1/IM - Managerが停止した場合は,再起動によって自動的に復旧できる場合があります。
プロセス再起動は,インストール時点では有効になっていません。有効にするには,拡張起動プロセス定義ファイル(jp1co_service_0700.conf)で「再起動可否」の項目を有効に設定します。
プロセス再起動の動作を,例として,jcamainプロセス(自動アクションサービス)の拡張起動プロセス定義ファイルの設定で説明します。なお,定義ファイルの詳細は,マニュアル「JP1/Integrated Management - Manager リファレンス 拡張起動プロセス定義ファイル(jp1co_service_0700.conf)」(3. 定義ファイル)を参照してください。
- 設定例
- jcamain|C:\Program Files\HITACHI\JP1Cons\bin\jcamain.exe||1|3|3|3600|
- 設定の意味
プロセス名:jcamain 再起動可否:1(再起動する。 デフォルトの0:再起動しない,から変更) 再起動回数:3回 (デフォルトのまま) リトライ間隔:3秒 (デフォルトのまま) 再起動回数リセット時間:3,600秒 (デフォルトのまま)定義は再起動可否だけを変更しています。ほかの値は,デフォルトで適切な値が指定されており,通常は変更しません。この設定の場合,次のように動作します。
図3-88 プロセスが異常終了した場合の動作例
図の例では,プロセスが再起動した後,再起動回数リセット時間で指定した3,600秒以内に異常終了しなかった場合は,再起動回数がリセットされます。次回異常終了したときには1回目からカウントされます。一方,再起動後,3,600秒以内に異常終了した場合は,再起動回数が加算されます。再起動回数が,指定した回数に達すると,それ以降は再起動をしません。
なお,Windowsの場合は,プロセスがアプリケーションエラーになると,ワトソン博士のメッセージボックスやMicrosoftへのエラー報告のダイアログが表示されることがあります。
- 注意
- 異常終了時の再起動設定は,クラスタ運用時には設定しないでください。JP1/IM - Managerの障害時にはプロセス再起動の機能も障害の影響を受けるおそれがあります。クラスタ運用時に再起動をしたい場合は,より確実に再起動を制御するためにJP1/IM - Manager外部のクラスタソフトから再起動を制御してください。
(2) プロセス異常検知時のJP1イベントの発行
JP1/IM - Managerは,プロセスの起動・終了処理での異常を検知した場合に,エラーメッセージを統合トレースログに出力しています。これらのエラーをJP1イベントとしても発行できます。
プロセス異常検知時のJP1イベント発行は,インストール時点では有効になっていません。有効にするには,IMパラメータ定義ファイル(jp1co_param_V7.conf)のJP1イベント発行の項目(SEND_PROCESS_TERMINATED_ABNORMALLY_EVENTおよびSEND_PROCESS_RESTART_EVENT)を有効に設定します。定義ファイルの詳細については,マニュアル「JP1/Integrated Management - Manager リファレンス IMパラメーター定義ファイル(jp1co_param_V7.conf)」(3. 定義ファイル)を参照してください。
プロセス異常検知時のJP1イベント発行を有効にすると,プロセスの状態が次の場合にJP1イベントを発行します。
- プロセスが異常終了した場合
- 起動時に起動通知がなく,タイムアウトした場合
- プロセス再起動の機能によって,異常終了したプロセスの再起動が完了した場合
All Rights Reserved. Copyright (C) 2006, 2008, Hitachi, Ltd.