Hitachi

JP1 Version 12 JP1/Performance Management 運用ガイド


17.6.2 トラブルが発生したときに資料を採取する手順(UNIXでPFM - Web Console以外の場合)

〈この項の構成〉

(1) 資料採取コマンドを実行する

トラブルの要因を調べるための資料の採取には,jpcrasコマンドを使用します。資料採取コマンドの実行手順を次に示します。なお,ここで説明する操作は,OSユーザーとしてrootユーザーが実行してください。

  1. 資料採取するサービスがインストールされているホストにログインする。

  2. 採取する資料および資料の格納先ディレクトリを指定して,jpcrasコマンドを実行する。

    jpcrasコマンドで,採取できるすべての情報を/tmp/jp1pc/mgrディレクトリに格納する場合の,コマンドの指定例を次に示します。

    jpcras /tmp/jp1pc/mgr all all

    資料採取コマンドで,収集された資料はtarコマンドとcompressコマンドまたはgzipコマンドで圧縮された形式で,指定されたディレクトリに格納されます。ファイル名を次に示します。

    jpcrasコマンドで採取された資料:jpcrasYYMMDD.tar.Z

    YYMMDDには年月日が付けられます。

jpcrasコマンドを実行すると,PFMサービスの一覧取得と起動状態の確認のため,内部的に「jpctool service list -id "*" -host "*"」コマンドが実行されます。コマンド実行ホストとほかのPFMシステム内のホストとの間にファイアウォールが設定されていたり,システム構成が大規模だったりすると,「jpctool service list -id "*" -host "*"」コマンドの実行に時間が掛かる場合があります。そのような場合は,環境変数「JPC_COLCTRLNOHOST」に1を設定することで「jpctool service list -id "*" -host "*"」コマンドの処理を抑止し,コマンドの実行時間を短縮できます。

jpcrasコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。

(2) 資料採取コマンドを実行する(論理ホスト運用の場合)

論理ホスト運用のPerformance Managementの資料は共有ディスクにあり,資料は実行系と待機系の両方で採取する必要があります。

トラブルの要因を調べるための資料の採取には,jpcrasコマンドを使用します。資料採取コマンドの実行手順を次に示します。なお,ここで説明する操作は,OSユーザーとしてrootユーザーが実行してください。

論理ホスト運用の場合の,資料採取コマンドの実行について,手順を説明します。

  1. 共有ディスクをマウントする。

    論理ホストの資料は共有ディスクに格納されています。実行系ノードでは,共有ディスクがマウントされていることを確認して資料を採取してください。

  2. 実行系と待機系の両方で,採取する資料および資料の格納先ディレクトリを指定して,jpcrasコマンドを実行する。

    jpcrasコマンドで,採取できるすべての情報を/tmp/jp1pc/mgrディレクトリに格納する場合の,コマンドの指定例を次に示します。

    jpcras /tmp/jp1pc/mgr all all

    資料採取コマンドで,収集された資料はtarコマンドとcompressコマンドまたはgzipコマンドで圧縮された形式で,指定されたディレクトリに格納されます。ファイル名を次に示します。

    jpcrasコマンドで採取された資料:jpcrasYYMMDD.tar.Z

    YYMMDDには年月日が付けられます。

    ヒント

    論理ホスト環境の調査では物理と論理のPFM資料が必要となります。共有Diskにつながっているノードでjpcrasコマンドのlhostの引数を指定なしで実行することで,そのノードの物理ホストと論理ホストのPerformance Managementの資料が一とおり採取されるようにしております。そのため,PFMが論理ホスト環境である場合はlhost引数は指定しないでください。

    なお,共有ディスクがマウントされていないノードでjpcrasコマンドを実行すると,共有ディスク上のファイルを取得できませんが,エラーは発生しないで正常終了します。

    注意

    実行系ノードと待機系ノードの両方で,資料採取コマンドを実行して資料採取をしてください。フェールオーバーの前後を調査するには,実行系と待機系の両方の資料が必要です。

  3. クラスタソフトの資料を採取する。

    この資料は,クラスタソフトとPerformance Managementのどちらでトラブルが発生しているのかを調査するために必要になります。クラスタソフトからPerformance Managementへの起動停止などの制御要求と結果を調査できる資料を採取してください。

jpcrasコマンドを実行すると,PFMサービスの一覧取得と起動状態の確認のため,内部的に「jpctool service list -id "*" -host "*"」コマンドが実行されます。コマンド実行ホストとほかのPFMシステム内のホストとの間にファイアウォールが設定されていたり,システム構成が大規模だったりすると,「jpctool service list -id "*" -host "*"」コマンドの実行に時間が掛かる場合があります。そのような場合は,環境変数「JPC_COLCTRLNOHOST」に1を設定することで「jpctool service list -id "*" -host "*"」コマンドの処理を抑止し,コマンドの実行時間を短縮できます。

jpcrasコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。

(3) オペレーション内容を確認する

トラブル発生時のオペレーション内容を確認し,記録しておいてください。確認が必要な情報を次に示します。

(4) エラー情報を採取する

次に示すエラー情報を採取してください。

(5) そのほかの情報を採取する

上記以外で必要な情報を採取してください。