17.5.15 特定の起動条件に対して予期しない大量のイベントが発生した場合などで処理が遅延した場合の対処方法

特定の起動条件に対して予期しない大量のイベントが発生した場合など,イベント・アクション制御マネージャーに未処理のデータが大量に蓄積する場合があります。この場合,イベントジョブに対する操作がしばらく経たないと行われない,条件に合致する事象が発生してもイベントジョブがなかなか正常終了しないなどの遅延が発生します。

このような場合に,イベント・アクション制御マネージャーが保持している情報を削除して運用を回復させることができます。

システムで問題が発生してから,運用状態を回復するまでの作業手順の例を次に示します。

  1. 特定の起動条件で予期しない大量イベントが発生する。
  2. マネージャーホストでの処理が追いつかないでスローダウンする。
    この影響で,他のイベントジョブがキューイングのままになるなどの現象が発生します。
  3. イベント・アクション制御マネージャーがKAVT0333-Wメッセージを統合トレースログに出力する。
  4. オペレーターが問題に気付き,3のメッセージからイベント・アクション制御マネージャーで問題が発生していることを認識する。
  5. jpomanevshowコマンドを実行し,データを送信してくる頻度が高いエージェント,および起動条件の情報を取得する。
  6. 5で取得した情報(ユニットID)を基に,次に示すどちらかのコマンドを使用してジョブネット名を特定する。
    • ajsnameコマンド
    • jpomanjobshowコマンド
  7. 6で特定した起動条件に対して強制終了する。
    強制終了できた場合は,ここで対策は終了となります。
  8. 7で回復できない場合,または6で起動条件を特定できなかった場合,JP1/AJS2運用状態での回復をあきらめ,JP1/AJS2サービスを停止する。
  9. 問題の発生しているエージェントに対してjpomanevresetコマンドによって,イベント・アクション制御マネージャーの状態を回復する。
  10. jpomanevresetコマンドで,イベントジョブや起動条件の継続を選択した場合,エージェントホストで1.が発生した原因を取り除く。
  11. JP1/AJS2サービスを起動する。

各コマンドの詳細については,次の記述個所を参照してください。