この節では,Cosminexusのシステムの運用中にトラブルが発生した場合の,対処の手順について説明します。
なお,トラブル発生時に取得する情報のうち,次に示す情報を取得するためには,運用開始前の準備が必要です。
- 日立JavaVM固有のログ(日立JavaVMログファイル)
このファイルには,JavaVMのガーベージコレクションのログも出力されます。
- ユーザダンプ(Windowsの場合)
- coreダンプ(UNIXの場合)
- OSの統計情報(Windowsの場合)
これらの情報については,必要に応じてシステム構築時に取得準備をしてください。詳細は,マニュアル「Cosminexus システム構築ガイド」のトラブルシューティングの資料取得の設定に関する説明を参照してください。
システムの運用中にトラブルが発生した場合,次の図に示す手順で対処します。
図5-1 トラブル発生時の対処の流れ
![[図データ]](FIGURE/ZU070010.GIF)
- 資料取得
トラブルシューティングに必要な資料をすべて取得します。
取得が必要な資料については,「5.2 取得が必要な資料の種類」を参照してください。なお,メモリダンプは,J2EEサーバまたはCORBAネーミングサービスを再起動する場合にだけ必要な資料です。
また,資料の取得方法については,「5.3 資料の取得」,または「5.4 資料の個別取得」を参照してください。
- 参考
- 資料の取得には,snapshotログとして一括して取得する方法と,個別のログを取得する方法があります。
- snapshotログの取得には,運用管理コマンドを使用して取得する方法,および設定によって自動で取得する方法があります。
- 論理サーバに異常が発生した場合の資料取得を自動化できます。詳細は,「5.3.2 トラブル発生時に自動的に取得できる資料」を参照してください。
- トラブル原因の判別(一次判別)
トラブルの原因を判別します。判別には,取得した資料を使用します。資料の調査方法については,「5.5 資料の調査」を参照してください。
- トラブルへの対処と回復
トラブルに対処して,回復します。
トラブルの種類ごとの対処方法については,「5.6 トラブルへの対処と回復」を参照してください。
- トラブル原因の解析(二次解析)
必要に応じてトラブル原因をさらに分析します。なお,この解析作業は保守員が実施します。
All Rights Reserved. Copyright (C) 2006, 2007, Hitachi, Ltd.