8.5.1 トラブルシューティング時にWindows環境で採取する資料の採取方法
- 〈この項の構成〉
(1) トラブルシューティング時のダンプ情報の採取方法
ダンプ情報の採取手順を次に示します。
-
タスクマネージャを開く。
-
プロセスのタブを選択する。
-
ダンプを取得するプロセス名を右クリックし,「ダンプ ファイルの作成」を選択する。
次のフォルダに,ダンプファイルが格納されます。
システムドライブ\Users\ユーザー名\AppData\Local\Temp
-
手順3のフォルダからダンプファイルを採取する。
手順3と異なるフォルダにダンプファイルが出力されるように環境変数の設定を変更している場合は,変更先のフォルダからダンプファイルを採取してください。
(2) 資料採取コマンドの実行によるトラブルシューティング資料の採取方法
トラブルの要因を調べるための資料の採取には,jpcrasコマンドを使用します。共通メッセージログなどPFMの保守情報に加えて,OpenTP1独自の保守情報を収集できます。資料採取コマンドの実行手順を次に示します。なお,ここで説明する操作をする場合,ユーザーはOSにAdministrators権限でログオンしてください。
-
資料採取するサービスがインストールされているホストにログオンする。
-
コマンドプロンプトで次に示すコマンドを実行して,コマンドインタープリターの「コマンド拡張機能」を有効にする。
cmd /E:ON
-
採取する資料および資料の格納先フォルダを指定して,jpcrasコマンドを実行する。
jpcrasコマンドで,採取できるすべての情報をc:\tmp\jpc\agtフォルダに格納する場合の,コマンドの指定例を次に示します。
jpcras c:\tmp\jpc\agt all all
jpcrasコマンドを実行すると,PFMサービスの一覧取得および起動状態の確認のため,内部的に「jpctool service list -id * -host *」コマンドが実行されます。コマンド実行ホストとほかのPerformance Managementシステムのホストとの間にファイアウォールが設定されていたり,システム構成が大規模だったりすると,「jpctool service list -id * -host *」コマンドの実行に時間が掛かる場合があります。そのような場合は,環境変数JPC_COLCTRLNOHOSTに1を設定することで「jpctool service list -id * -host *」コマンドの処理を抑止し,コマンドの実行時間を短縮できます。
jpcrasコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。
補足
-
PFM - Agent for OpenTP1固有の情報を採取する場合,サービスキーにallまたはagthを指定し,採取資料を選択するオプション([all | data | dump])の指定を省略するか,allを指定する必要があります。OSのユーザーアカウント制御機能(UAC)を有効にしている場合は,コマンド実行時にユーザーアカウント制御のダイアログが表示されることがあります。ダイアログが表示された場合は,「続行」ボタンをクリックして資料採取を続行してください。「キャンセル」ボタンをクリックした場合は,資料採取が中止されます。
-
PFM - Agent for OpenTP1固有の情報を採取する場合,OpenTP1の保守情報を採取するために,OpenTP1のdcrasgetコマンドが実行されます。このとき,OpenTP1のcoreファイルなどが大量に存在すると,dcrasgetコマンドの実行に時間が掛かるおそれがあります。このような場合に,環境変数「JPCAGTH_COLNOTP1RAS」に1を設定することでdcrasgetコマンドの処理を抑止し,コマンドの実行時間を短縮できます。
-
(3) 資料採取コマンドの実行によるトラブルシューティング資料の採取方法(論理ホスト運用の場合)
論理ホスト運用のPerformance Managementの資料は共有ディスクにあり,資料は実行系と待機系の両方で採取する必要があります。
トラブルの要因を調べるための資料の採取には,jpcrasコマンドを使用します。資料採取コマンドの実行手順を次に示します。なお,ここで説明する操作は,OSユーザーとしてAdministrators権限を持つユーザーが実行してください。
論理ホスト運用の場合の資料採取コマンドの実行について,手順を説明します。
-
共有ディスクをオンラインにする。
論理ホストの資料は共有ディスクに格納されています。実行系ノードでは,共有ディスクがオンラインになっていることを確認して資料を採取してください。
-
実行系と待機系の両方で,採取する資料および資料の格納先フォルダを指定して,jpcrasコマンドを実行する。
jpcrasコマンドで,採取できるすべての情報をc:\tmp\jpc\agtフォルダに格納する場合の,コマンドの指定例を次に示します。
jpcras c:\tmp\jpc\agt all all
jpcrasコマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。
補足
-
PFM - Agent for OpenTP1固有の情報を採取する場合,サービスキーにallまたはagthを指定し,採取資料を選択するオプション([all | data | dump])の指定を省略するか,allを指定する必要があります。OSのユーザーアカウント制御機能(UAC)を有効にしている場合は,コマンド実行時にユーザーアカウント制御のダイアログが表示されることがあります。ダイアログが表示された場合は,「続行」ボタンをクリックして資料採取を続行してください。「キャンセル」ボタンをクリックした場合は,資料採取が中止されます。
-
PFM - Agent for OpenTP1固有の情報を採取する場合,OpenTP1の保守情報を採取するために,OpenTP1のdcrasgetコマンドが実行されます。このとき,OpenTP1のcoreファイルなどが大量に存在すると,dcrasgetコマンドの実行に時間が掛かるおそれがあります。このような場合に,環境変数「JPCAGTH_COLNOTP1RAS」に1を設定することでdcrasgetコマンドの処理を抑止し,コマンドの実行時間を短縮できます。
-
jpcrasコマンドをlhostの引数を指定しないで実行すると,そのノードの物理ホストと論理ホストのPerformance Managementの資料が一とおり採取されます。論理ホスト環境のPerformance Managementがある場合は,共有ディスク上のログファイルが取得されます。
-
共有ディスクがオフラインになっているノードでjpcrasコマンドを実行すると,KAVE05242-Wが出力されます。このとき,共有ディスク上のファイルおよびOpenTP1の保守情報は取得されませんが,jpcrasコマンドは正常終了します。
- 注意
-
実行系ノードと待機系ノードの両方で,資料採取コマンドを実行して資料採取をしてください。フェールオーバーの前後の調査をするには,実行系と待機系の両方の資料が必要です。
-
-
クラスタソフトの資料を採取する。
この資料は,クラスタソフトとPerformance Managementのどちらでトラブルが発生しているのかを調査するために必要になります。クラスタソフトからPerformance Managementへの起動停止などの制御要求と結果を調査できる資料を採取してください。
(4) トラブルシューティング時のWindowsイベントログ資料の採取方法
Windowsの[イベントビューア]ウィンドウで,Windowsイベントログをファイルに出力してください。
(5) トラブルシューティング時に確認するオペレーション内容の採取方法
トラブル発生時のオペレーション内容を確認し,記録しておいてください。確認が必要な情報を次に示します。
-
オペレーション内容の詳細
-
トラブル発生時刻
-
マシン構成(各OSのバージョン,ホスト名,PFM - ManagerとPFM - Agentの構成など)
-
再現性の有無
-
PFM - Web Consoleからログインしている場合は,ログイン時のPerformance Managementユーザー名
(6) トラブルシューティング時の画面上のエラー情報の採取方法
次に示すハードコピーを採取してください。
-
アプリケーションエラーが発生した場合は,操作画面のハードコピー
-
エラーメッセージダイアログボックスのハードコピー
詳細情報がある場合はその内容をコピーしてください。
-
コマンド実行時にトラブルが発生した場合は,[コマンドプロンプト]ウィンドウまたは[管理者コンソール]ウィンドウのハードコピー
[コマンドプロンプト]ウィンドウまたは[管理者コンソール]ウィンドウのハードコピーを採取する際は,["コマンドプロンプト"のプロパティ]ウィンドウについて次のように設定しておいてください。
-
[オプション]タブの[編集オプション]
[簡易編集モード]がチェックされた状態にする。
-
[レイアウト]タブ
[画面バッファのサイズ]の[高さ]に「500」を設定する。
-
(7) トラブルシューティング時に採取するその他の資料の採取方法
上記以外で必要な情報を採取してください。
-
コマンド実行時にトラブルが発生した場合は,コマンドに指定した引数
-
[アクセサリ]−[システムツール]−[システム情報]の内容
-
Windowsの[イベントビューア]ウィンドウを開き,左ペイン[Windowsログ]の,[システム]および[アプリケーション]の内容