Cosminexus システム運用ガイド

[目次][用語][索引][前へ][次へ]

5.1 対処の手順

この節では,Cosminexusのシステムの運用中にトラブルが発生した場合の,対処の手順について説明します。

なお,トラブル発生時に取得する情報のうち,次に示す情報を取得するためには,運用開始前の準備が必要です。

これらの情報については,必要に応じてシステム構築時に取得準備をしてください。詳細は,マニュアル「Cosminexus システム構築ガイド」のトラブルシューティングの資料取得の設定に関する説明を参照してください。

システムの運用中にトラブルが発生した場合,次の図に示す手順で対処します。

図5-1 トラブル発生時の対処の流れ

[図データ]

  1. 資料取得
    トラブルシューティングに必要な資料をすべて取得します。
    取得が必要な資料については,「5.2 取得が必要な資料の種類」を参照してください。なお,メモリダンプは,J2EEサーバまたはCORBAネーミングサービスを再起動する場合にだけ必要な資料です。
    また,資料の取得方法については,「5.3 資料の取得」,または「5.4 資料の個別取得」を参照してください。
    参考
    • 資料の取得には,snapshotログとして一括して取得する方法と,個別のログを取得する方法があります。
    • snapshotログの取得には,運用管理コマンドを使用して取得する方法,および設定によって自動で取得する方法があります。
    • 論理サーバに異常が発生した場合の資料取得を自動化できます。詳細は,「5.3.2 トラブル発生時に自動的に取得できる資料」を参照してください。
  2. トラブル原因の判別(一次判別)
    トラブルの原因を判別します。判別には,取得した資料を使用します。資料の調査方法については,「5.5 資料の調査」を参照してください。
  3. トラブルへの対処と回復
    トラブルに対処して,回復します。
    トラブルの種類ごとの対処方法については,「5.6 トラブルへの対処と回復」を参照してください。
  4. トラブル原因の解析(二次解析)
    必要に応じてトラブル原因をさらに分析します。なお,この解析作業は保守員が実施します。