10.5.2 トラブルシューティング時にUNIX環境で採取する資料の採取方法
(1) 資料採取コマンドを実行する
トラブルの要因を調べるための資料の採取には,jpcrasコマンドを使用します。資料採取コマンドの実行手順を次に示します。なお,ここで説明する操作は,OSユーザーとしてrootユーザー権限を持つユーザーが実行してください。
-
資料採取するサービスがインストールされているホストにログインする。
-
採取する資料および資料の格納先ディレクトリを指定して,jpcrasコマンドを実行する。
jpcrasコマンドで,採取できるすべての情報を/tmp/jpc/agtディレクトリに格納する場合の,コマンドの指定例を次に示します。
jpcras /tmp/jpc/agt all all
資料採取コマンドで収集された資料は,tarコマンドおよびcompressコマンドで圧縮された形式で,指定されたディレクトリに格納されます。ファイル名を次に示します。
jpcrasYYMMDD※.tar.Z
注※ YYMMDDには年月日が付加されます。
jpcrasコマンドを実行すると,PFMサービスの一覧取得および起動状態の確認のため,内部的にjpctool service list -id * -host * コマンドが実行されます。コマンド実行ホストとほかのPerformance Managementシステムのホストとの間にファイアウォールが設定されていたり,システム構成が大規模だったりすると,jpctool service list -id * -host * コマンドの実行に時間が掛かる場合があります。そのような場合は,環境変数JPC_COLCTRLNOHOSTに1を設定することでjpctool service list -id * -host * コマンドの処理を抑止し,コマンドの実行時間を短縮できます。
jpcrasコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」のコマンドについて説明している章を参照してください。
(2) 資料採取コマンドを実行する(論理ホストで運用する場合)
論理ホストで運用するPerformance Managementの資料は共有ディスクにあり,資料は実行系と待機系の両方で採取する必要があります。トラブルの要因を調べるための資料の採取には,jpcrasコマンドを使用します。資料採取コマンドの実行手順を次に示します。なお,ここで説明する操作は,OSユーザーとしてrootユーザー権限を持つユーザーが実行してください。
-
共有ディスクをマウントする。
論理ホストの資料は共有ディスクに格納されています。実行系ノードでは,共有ディスクがマウントされていることを確認して資料を採取してください。
-
実行系と待機系の両方で,採取する資料および資料の格納先ディレクトリを指定して,jpcrasコマンドを実行する。
jpcrasコマンドで,採取できるすべての情報を/tmp/jpc/agtディレクトリに格納する場合の,コマンドの指定例を次に示します。
jpcras /tmp/jpc/agt all all
資料採取コマンドで収集された資料は,tarコマンドおよびcompressコマンドで圧縮された形式で,指定されたディレクトリに格納されます。ファイル名を次に示します。
jpcrasYYMMDD※.tar.Z
注※ YYMMDDには年月日が付加されます。
jpcrasコマンドをlhostの引数を指定しないで実行すると,そのノードの物理ホストと論理ホストのPerformance Managementの資料が一とおり採取されます。論理ホスト環境のPerformance Managementがある場合は,共有ディスク上のログファイルが取得されます。
なお,共有ディスクがマウントされていないノードでjpcrasコマンドを実行すると,共有ディスク上のファイルを取得できません。ただし,エラーは発生しないで正常終了します。
- 注意
-
実行系ノードと待機系ノードの両方で,資料採取コマンドを実行して資料採取をしてください。フェールオーバーの前後の調査をするには,実行系と待機系の両方の資料が必要です。
jpcrasコマンドについては,マニュアル「JP1/Performance Management リファレンス」のコマンドについて説明している章を参照してください。
-
クラスタソフトの資料を採取する。
この資料は,クラスタソフトとPerformance Managementのどちらでトラブルが発生しているのかを調査するために必要になります。クラスタソフトからPerformance Managementへの起動停止などの制御要求と結果を調査できる資料を採取してください。
(3) オペレーション内容を確認する
トラブル発生時のオペレーション内容を確認し,記録しておいてください。確認が必要な情報を次に示します。
-
オペレーション内容の詳細
-
トラブル発生時刻
-
マシン構成(各OSのバージョン,ホスト名,PFM - ManagerとPFM - RM for Platformの構成など)
-
再現性の有無
-
PFM - Web Consoleからログインしている場合は,ログイン時のPerformance Managementユーザー名
-
コマンド実行時にトラブルが発生した場合は,コマンドに指定した引数
(4) 画面上のエラー情報を採取する
次に示すエラー情報を採取してください。
-
コマンド実行時にトラブルが発生した場合は,コンソールに出力されたメッセージ