Hitachi

JP1 Version 10 JP1/Automatic Job Management System 3 運用ガイド


7.3 JP1/AJS3のプロセスが異常終了した場合のJP1/AJS3の動作を変更する

JP1/AJS3が何らかの理由によって停止すると,ジョブが実行できなくなり,分散システムの業務に影響を及ぼします。

JP1/AJS3では,障害が発生してプロセスが停止した場合,障害が発生したプロセスを再起動し自動回復を行います。再起動しても回復できない場合,障害が発生したプロセス以外のプロセスは停止しないで縮退運転します。プロセスが異常終了した場合に自動で再起動するプロセスについては,「7.3.1 異常終了したJP1/AJS3のプロセスを再起動する」を参照してください。

縮退運転の場合,動作しているプロセスによって一部の機能は使用できます。

JP1/AJS3サービス内のプロセスは,jajs_spmd_statusコマンドで表示できます。

プロセスの機能については,マニュアル「JP1/Automatic Job Management System 3 トラブルシューティング 付録B プロセス一覧」を参照してください。

スケジューラーサービス管理機能のプロセスが停止した場合でも,エージェントサービス機能のプロセス(ジョブ実行・イベントジョブ機能)は停止しません。このため,スケジューラーサービス管理機能のプロセスが停止した場合でも,他ホストからの実行要求によるジョブ・イベントジョブの実行は継続できます。

現在JP1/AJS3サービスが縮退運転しているかどうかもjajs_spmd_statusコマンドで確認できます。

また,jajs_spmdコマンドに-HAオプションを指定した場合,およびクラスタ構成時の論理ホストのJP1/AJS3サービスに障害が発生した場合は,縮退運転しません。JP1/AJS3サービスの,jajs_spmd_statusコマンドで表示されるプロセスのどれかが停止しても,JP1/AJS3サービス全体が停止します。

物理ホスト上のJP1/AJS3で縮退運転させないで,異常を検知するためにはjajs_spmdコマンドに-HAオプションを指定して起動してください。JP1/AJS3サービス全体を停止できます。

また,上記動作のほかに障害発生時に障害を検知して対処する手段として,プロセスの異常を検知した場合にJP1イベントを発行する機能を提供しています。この機能をあらかじめ設定しておくことで,プロセスが異常終了した場合,JP1イベントを発行させることができます。

JP1イベントを発行する場合は,発行されたJP1イベントを契機として,JP1/IMなどの他プログラムと組み合わせて自動的に連絡する処理を実行できます。

プロセスの異常を検知した場合にJP1イベントを発行する機能については以降の項を参照してください。

〈この節の構成〉