Hitachi

JP1 Version 12 JP1/Performance Management - Agent Option for OpenTP1


8.5.2 トラブルシューティング時にUNIX環境で採取する資料の採取方法

〈この項の構成〉

(1) 資料採取コマンドの実行によるトラブルシューティング資料の採取方法

トラブルの要因を調べるための資料の採取には,jpcrasコマンドを使用します。資料採取コマンドの実行手順を次に示します。なお,ここで説明する操作は,OSユーザーとしてrootユーザー権限を持つユーザーが実行してください。

  1. 資料採取するサービスがインストールされているホストにログインする。

  2. 採取する資料および資料の格納先ディレクトリを指定して,jpcrasコマンドを実行する。

    jpcrasコマンドで,採取できるすべての情報を/tmp/jpc/agtディレクトリに格納する場合の,コマンドの指定例を次に示します。

    jpcras /tmp/jpc/agt all all

jpcrasコマンドを実行すると,PFMサービスの一覧取得および起動状態の確認のため,内部的に「jpctool service list -id * -host *」コマンドが実行されます。コマンド実行ホストとほかのPerformance Managementシステムのホストとの間にファイアウォールが設定されていたり,システム構成が大規模だったりすると,「jpctool service list -id * -host *」コマンドの実行に時間が掛かる場合があります。そのような場合は,環境変数JPC_COLCTRLNOHOSTに1を設定することで「jpctool service list -id * -host *」コマンドの処理を抑止し,コマンドの実行時間を短縮できます。

jpcrasコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。

補足
  • PFM - Agent for OpenTP1固有の情報を採取する場合,サービスキーにallまたはagthを指定し,採取資料を選択するオプション([all | data | dump])の指定を省略するか,allを指定する必要があります。

  • PFM - Agent for OpenTP1固有の情報を採取する場合,OpenTP1の保守情報を採取するために,OpenTP1のdcrasgetコマンドが実行されます。このとき,OpenTP1のcoreファイルなどが大量に存在すると,dcrasgetコマンドの実行に時間が掛かるおそれがあります。このような場合に,環境変数「JPCAGTH_COLNOTP1RAS」に1を設定することでdcrasgetコマンドの処理を抑止し,コマンドの実行時間を短縮できます。

  • 資料採取コマンドで収集された資料は,tarコマンドおよびcompressコマンドで圧縮された形式で,指定されたディレクトリに格納されます。ファイル名を次に示します。

    jpcrasYYMMDD.tar.Z

    YYMMDDの部分は実行年月日を表します。

(2) 資料採取コマンドの実行によるトラブルシューティング資料の採取方法(論理ホスト運用の場合)

論理ホスト運用のPerformance Managementの資料は共有ディスクにあり,資料は実行系と待機系の両方で採取する必要があります。

トラブルの要因を調べるための資料の採取には,jpcrasコマンドを使用します。資料採取コマンドの実行手順を次に示します。なお,ここで説明する操作は,OSユーザーとしてrootユーザー権限を持つユーザーが実行してください。

論理ホスト運用の場合の,資料採取コマンドの実行について,手順を説明します。

  1. 共有ディスクをマウントする。

    論理ホストの資料は共有ディスクに格納されています。実行系ノードでは,共有ディスクがマウントされていることを確認して資料を採取してください。

  2. 実行系と待機系の両方で,採取する資料および資料の格納先ディレクトリを指定して,jpcrasコマンドを実行する。

    jpcrasコマンドで,採取できるすべての情報を/tmp/jpc/agtディレクトリに格納する場合の,コマンドの指定例を次に示します。

    jpcras /tmp/jpc/agt all all
    • 資料採取コマンドで収集された資料は,tarコマンドおよびcompressコマンドで圧縮された形式で,指定されたディレクトリに格納されます。ファイル名を次に示します。

      jpcrasYYMMDD.tar.Z

      YYMMDDの部分は実行年月日を表します。

    • jpcrasコマンドをlhostの引数を指定しないで実行すると,そのノードの物理ホストと論理ホストのPerformance Managementの資料が一とおり採取されます。論理ホスト環境のPerformance Managementがある場合は,共有ディスク上のログファイルが取得されます。

    • 共有ディスクがマウントされていないノードでjpcrasコマンドを実行すると,KAVE05242-Wが出力されます。このとき,共有ディスク上のファイルおよびOpenTP1の保守情報は取得されませんが,jpcrasコマンドは正常終了します。

    注意

    実行系ノードと待機系ノードの両方で,資料採取コマンドを実行して資料採取をしてください。フェールオーバーの前後の調査をするには,実行系と待機系の両方の資料が必要です。

    jpcrasコマンドについては,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。

  3. クラスタソフトの資料を採取する。

    この資料は,クラスタソフトとPerformance Managementのどちらでトラブルが発生しているのかを調査するために必要になります。クラスタソフトからPerformance Managementへの起動停止などの制御要求と結果を調査できる資料を採取してください。

(3) トラブルシューティング時に確認するオペレーション内容の採取方法

トラブル発生時のオペレーション内容を確認し,記録しておいてください。確認が必要な情報を次に示します。

(4) トラブルシューティング時のエラー情報の採取方法

次に示すエラー情報を採取してください。

(5) トラブルシューティング時に採取するその他の資料の採取方法

上記以外で必要な情報を採取してください。