2.6 起動条件付きジョブネットの処理が遅延した場合の対処

特定の起動条件付きジョブネットに対して予期しない大量のイベントが発生した場合など,イベント・アクション制御マネージャーに未処理のデータが大量に蓄積する場合があります。この場合,イベントジョブに対する操作がしばらく経たないと行われない,条件に合致する事象が発生してもイベントジョブがなかなか正常終了しないなどの遅延が発生します。

このような場合に,イベント・アクション制御マネージャーが保持している情報を削除して運用を回復させることができます。

システムで問題が発生してから,運用状態を回復するまでの作業手順の例を次に示します。

  1. 特定の起動条件付きジョブネットで予期しない大量イベントが発生する。
  2. マネージャーホストでの処理が追いつかないでスローダウンする。
    この影響で,ほかのイベントジョブがキューイングのままになるなどの現象が発生します。
  3. イベント・アクション制御マネージャーがメッセージKAVT0333-Wを統合トレースログに出力する。
  4. オペレーターが問題に気づき,3のメッセージからイベント・アクション制御マネージャーで問題が発生していることを認識する。
  5. jpomanevshowコマンドを実行し,データを送信してくる頻度が高いエージェント,および起動条件付きジョブネットの情報を取得する。
  6. 5で取得した情報(ユニットID)を基に,次に示すどちらかのコマンドを使用してジョブネット名を特定する。
    • ajsnameコマンド
      ユニット名を標準出力ファイルに出力する。
    • jpomanjobshowコマンド
      マネージャーで実行中のイベントジョブの一覧を標準出力ファイルに出力する。
  7. 6で特定した起動条件付きジョブネットを強制終了する。
    強制終了できた場合は,ここで対策は終了となります。
  8. 7で強制終了できない場合,または6で起動条件を特定できなかった場合,JP1/AJS3運用状態での回復は困難と判断し,起動条件付きジョブネットを実行しているスケジューラーサービスを停止する。
  9. 問題の発生しているエージェントに対して,8で停止したスケジューラーサービスを指定してjpomanevresetコマンドを実行し,イベント・アクション制御マネージャーの状態を回復する。
  10. jpomanevresetコマンドで,イベントジョブや起動条件の継続を選択した場合,エージェントホストで1が発生した原因を取り除く。
  11. 8で停止したスケジューラーサービスを起動する。

各コマンドの詳細については,マニュアル「JP1/Automatic Job Management System 3 コマンドリファレンス1 2. コマンド」を参照してください。また,スケジューラーサービスの停止方法については,マニュアル「JP1/Automatic Job Management System 3 運用ガイド 8.5.2 スケジューラーサービスを停止する」を参照してください。