26.2 トラブルが発生したときに採取が必要な資料
(1) トラブル内容の確認で採取する情報
トラブルが発生したら,トラブルの内容とトラブルが発生した経緯を正確に,かつ詳細に把握することが,トラブル解決の手助けとなります。次の情報の採取が必要です。
- トラブルの内容
どのような状況(環境構築中,システム運用中など)で,どのような問題が発生しているかを正確に把握してください。
- トラブル発生時刻
ログファイルにも時刻は出力されますが,複数のトラブルが記録されている場合もあります。トラブルをスムーズに解析するために,トラブルが発生した時刻を把握してください。
- オペレーション内容の詳細
オペレーションによってトラブルが発生した場合,できるだけ詳細にオペレーション内容を把握してください。
(2) 画面表示内容の確認で採取する資料
メッセージが出力されている場合は,メッセージの内容を確認してください。各メッセージの要因と対処方法については,マニュアル「JP1 Version 8 JP1/ServerConductor/Blade Server Manager系 メッセージ」を参照してください。
また,発生したトラブルの内容が判断できるエラー情報が画面上に表示されている場合,画面のハードコピーを採取してください。エラー情報の例を次に示します。
- ポップアップ画面
- 操作画面(アプリケーションエラーが発生した場合)
- エラーメッセージダイアログボックス
[詳細]ボタンがある場合は,[詳細]ボタンをクリックしたときに表示される内容のハードコピーも採取してください。
- コマンド実行画面(Linuxでコマンド実行時にトラブルが発生した場合)
(3) ログファイル
トラブル原因解析のために必要となる,JP1/ServerConductorの各製品のログの採取が必要です。また,N+1/N+Mコールドスタンバイ機能やJP1/IM連携など,ほかのハードウェア製品やソフトウェア製品との関連性が考えられる場合,関連ハードウェア製品および関連ソフトウェア製品のログの採取が必要です。
採取が必要なログファイルを次に示します。
- サーバアラートログ
ハードウェアのアラートがトラブルに起因しているかを調べるための情報となります。
- SVPログ
サーバアラートログとともに,SVPのアラートがトラブルに起因しているかどうかを調べるための情報となります。
- マネージャアラートログ
管理サーバで発生したアラートがトラブルに起因しているかどうかを調べるための情報となります。
- 管理コンソールの操作ログ
エラー発生時のユーザの操作を確認するための情報となります。
- JP1/ServerConductorの各製品のログ
管理サーバ,管理対象サーバでトラブルが発生した場合,すべての条件で必要な情報です。
- イベントログ情報(Windowsの場合)
保守情報のOS情報が取得できない場合,トラブルが発生したシステムの動作状況を把握するための情報となります。
- システムログ情報(LinuxまたはHP-UXの場合)
保守情報のOS情報が取得できない場合,トラブルが発生したシステムの動作状況を把握するための情報となります。
採取するログ情報の種類および採取方法は各製品の適用OSごとに異なります。採取方法については,「26.3 資料の採取方法」を参照してください。
- 注意
- JP1/ServerConductorの各製品のログについての注意事項を次に示します。
- JP1/ServerConductorの各製品から出力されるログファイルは削除しないでください。障害発生時に原因の究明ができなくなります。また,製品の動作に影響を及ぼす可能性があります。
- 別の製品(アンチウィルス製品含む)によるログ監視の対象として指定しないでください。JP1/ServerConductorの各製品のログファイルの内容は非公開であり,内容が予告なく変更されることがあります。また,ログ監視によって製品の動作に影響を及ぼす可能性があります。
(4) ネットワーク情報
[ホスト管理]ウィンドウ上のアイコンが活性化されない,電源がONできないなど,ネットワークに問題がある可能性がある場合,ネットワーク情報の採取が必要です。
また,ファイアウォールの設定内容やネットワークスイッチの設定内容に誤りがないこと,およびネットワーク構成に誤りがないことを確認してください。
ネットワーク情報の採取方法は各製品の適用OSごとに異なります。採取方法については,「26.3 資料の採取方法」を参照してください。
- 注意
- ログファイルがラップアラウンドしてしまう可能性があるため,確認を実施する前に,ログファイルを採取してください。
(5) システム構成情報
トラブルとシステム構成に因果関係がないかどうかを調査するため,次に示すシステム構成情報の採取が必要です。
- マシン構成図およびネットワーク構成図
ネットワーク機器構成を含めた,マネージャサービス,エージェントサービスおよびコンソールサービスの構成(ホスト名,IPアドレス,MACアドレス,BladeSymphonyの場合,シャーシ情報など)が記載してある資料
- 注意
- この資料は,トラブルが発生したマシンとの因果関係を調査するために必要となります。環境構成の変更でトラブルが発生した場合は,変更前後の情報を採取してください。情報が誤っている場合,要因の特定が困難になる場合があるので,必ず最新のものを採取してください。
- マシンの形名情報,製造番号
- 管理対象サーバの保守情報
管理対象サーバの保守情報の採取方法については,「11.2 保守情報の取得と環境設定」を参照してください。
(6) システム情報
発生したシステムの状態を正確に把握するため,システム情報の採取が必要です。
システム情報の採取方法は各製品の適用OSごとに異なります。採取方法については,「26.3 資料の採取方法」を参照してください。
(7) レジストリ情報(Windowsの場合)
Windowsの場合,システムの設定値などを確認するため,レジストリ情報の採取が必要です。採取方法については,「26.3 資料の採取方法」を参照してください。
(8) 関連製品・連携製品の情報
関連製品との連携で発生したトラブルの場合,トラブルの解析に必要な情報の採取が必要です。必要な情報の例を次に示します。
- 連携ハードウェアの情報
- SVP,BIOSなどのハードウェア関連情報
- 各連携ソフトウェア製品の情報
- クラスタ構成情報,クラスタログなどのクラスタ関連情報