Hitachi

JP1 Version 12 JP1/Performance Management 運用ガイド


17.2.9 パフォーマンスデータの収集と管理に関するトラブルシューティング

〈この項の構成〉

(1) データの保存期間を短く設定したにも関わらず,Agent StoreのStoreデータベースのサイズが小さくならない

Storeバージョン1.0でStoreデータベースのファイル容量がすでに限界に達している場合,データの保存期間を短く設定してもファイルサイズは小さくなりません。この場合,保存期間を短く設定したあと,いったんStoreデータベースをバックアップし,リストアし直してください。

データの保存期間の設定方法については,「4.1.2 パフォーマンスデータの保存条件を変更する(Storeバージョン2.0の場合)」または「4.1.3 パフォーマンスデータの保存条件を変更する(Storeバージョン1.0の場合)」を参照してください。また,Agent StoreおよびRemote Monitor Storeデータベースのバックアップとリストアの方法については,「9.3.3 パフォーマンスデータのバックアップとリストア」を参照してください。

(2) 共通メッセージログに「KAVE00128-E」,「KAVE00163-E」および「KAVE00103-E」などのメッセージが出力され,Storeサービスの起動に失敗する

予期しないPFMサービスの停止またはマシンの電源断などの強制停止などによって,Storeデータベースに不整合なデータが発生したおそれがあります。次の方法で対処をしてください。

[StoreVRが1.0の場合]
  • 拡張子が.DBであるファイル

  • 拡張子が.IDXであるファイル

[StoreVRが2.0の場合]
  • 拡張子が.DBであるファイル

  • 拡張子が.IDXであるファイル

    STPI,STPD,STPLディレクトリ配下を削除してください。

    (STPI,STPD,STPLディレクトリは残してください)

デフォルトのStoreデータベースの格納先ディレクトリは,次のとおりです。

パフォーマンスデータのStoreデータベース格納先ディレクトリ

各PFM - AgentまたはPFM - RMマニュアルを参照してください。

イベントデータのStoreデータベースの格納先ディレクトリ
[PFM - Managerがクラスタ環境でない場合]
  • Windowsの場合:

    インストール先フォルダ\mgr\store\

  • UNIXの場合:

    /opt/jp1pc/mgr/store/

[PFM - Managerがクラスタ環境である場合]
  • Windowsの場合:

    環境ディレクトリ\jp1pc\mgr\store\

  • UNIXの場合:

    環境ディレクトリ/jp1pc/mgr/store/

(3) パフォーマンスデータ収集時にKAVE00213-Wが出力されて収集がスキップされる

Agent CollectorサービスおよびRemote Monitor Collectorサービスによるパフォーマンスデータの収集は,レコードごとにスケジューリングされます。収集時に,ほかのレコードの収集や前回の収集が完了していない場合,収集はスキップされます。

この現象を防止する方法として,次の2つがあります。

なお,ここで示している方法はどちらも,処理がスケジュールどおり実行されることを前提とした対策です。このため,監視対象からのレスポンスの低下などによって予定より処理に時間が掛かった場合など,収集のスキップを防止できないこともあります。

(a) Collection Offsetプロパティの指定の有無による収集動作の違い

レコードにCollection Offsetプロパティを指定した場合,該当するレコードの収集を指定した値の分だけずらします。

Collection Offsetプロパティの指定の有無による収集動作の違いを次の図に示します。

図17‒2 Collection Offsetプロパティの指定の有無による収集動作の違い

[図データ]

(b) 履歴データの収集を優先する場合のリアルタイムレポートの表示処理について

監視エージェントの起動情報ファイル(jpccomm.ini)でHistorical Data Collection Priority Modeの値を1(有効)にすると,リアルタイムレポートの表示が通常の処理から[再スケジュールモード]または[一時保存モード]のどちらかに変更されます。これによって,履歴データの収集タイミングがリアルタイムレポートの表示のための収集処理と重なるのが防止されます。

  • [再スケジュールモード]

    リアルタイムレポートの表示要求があった場合,以降の履歴データの収集スケジュールが自動的に確認され,重なるおそれがあるときはリアルタイムレポートの表示処理が再スケジュールされます。

    ただし,このモードは,収集に時間の掛かるレコード,およびグループエージェントには適用できません。

    図17‒3 再スケジュールモードの概要

    [図データ]

    詳細は,「17.2.9(3)(d) リアルタイムレポートを[再スケジュールモード]で表示する場合の動作」を参照してください。

  • [一時保存モード]

    リアルタイムレポートの表示に必要なデータが定期的に自動収集され,最新データだけがメモリー上に一時保存されます。リアルタイムレポートの表示要求があった場合,この一時保存データを使って表示されます。

    収集に掛かる時間に関係なくすべてのレコードに有効です。

    図17‒4 一時保存モードの概要

    [図データ]

    詳細は,「17.2.9(3)(e) リアルタイムレポートを[一時保存モード]で表示する場合の動作」を参照してください。

最初にjpccomm.iniファイルでHistorical Data Collection Priority Modeを有効にした時点では,[再スケジュールモード]となります。

(c) リアルタイムレポートの動作モードの変更方法

監視エージェントの起動情報ファイル(jpccomm.ini)でHistorical Data Collection Priority Modeの値を1(有効)にしている場合のリアルタイムレポートの動作モード([再スケジュールモード]または[一時保存モード])は,画面またはコマンドで変更できます。

[サービスのプロパティ]画面での変更方法

対象の監視エージェントのAgent Collectorサービス,またはリモートエージェントのサービスのプロパティで,リアルタイムレポートとして利用するレコードごとに,Realtime Report Data Collection Modeプロパティの値を変更します。

コマンドでの変更方法

jpcasrec outputコマンドで現在の定義内容をXML形式のファイルに出力し,<realtime-report-data-collection-mode>タグの値を変更して保存して,jpcasrec updateコマンドで定義内容を更新します。

指定する値(画面とコマンドで共通)

Realtime Report Data Collection Modeプロパティと<realtime-report-data-collection-mode>タグで,指定する値は共通です。次のどちらかを指定してください。

  • 「Reschedule」(再スケジュールモード)

  • 「Temporary Log」(一時保存モード)

Realtime Report Data Collection Modeプロパティ(Agent Collectorサービス,またはリモートエージェントのサービスのプロパティ)については,各エージェントのマニュアルの付録を参照してください。また,各コマンドの詳細については,マニュアル「JP1/Performance Management リファレンス」の,コマンドについて説明している章を参照してください。

(d) リアルタイムレポートを[再スケジュールモード]で表示する場合の動作

リアルタイムレポートを[再スケジュールモード]で表示する場合,通常のリアルタイムレポートの表示処理とは,次に示す違いがあります。

  • 表示要求から10秒以内に履歴データの収集が予定されている場合は,リアルタイムレポートの表示が再スケジュールされます。この場合リアルタイムレポートは,履歴データの収集スケジュールに10秒以上の空きがあるタイミングで表示されます。

    • 表示要求後,10秒以上の空きのあるタイミングでリアルタイムレポートが表示されます。再スケジュールする設定だとわかるように,レポートを表示する画面では上部に[再スケジュールモード]と表示され,jpcrptコマンドでは設定されているモードを示すメッセージが実行時に出力されます。

    • データの収集に10秒以上掛かるレコードは,画面にエラーメッセージが表示されてリアルタイムレポートが表示できません。

      これらのレコードについては,[一時保存モード]で表示することを検討してください。

      データの収集に10秒以上掛かると想定されているレコードは,Over 10 Sec Collection Timeプロパティの値が「Yes」になっています。グループエージェントでは,すべてのレコードが該当します。なお,このほかのレコードでも,環境によってはデータの収集に10秒以上掛かってリアルタイムレポートが表示できない場合があります。

      注※ エージェントの起動情報ファイル(jpccomm.ini)で,Historical Data Collection Priority Modeの値を1(有効)にしている場合にだけ表示されます。

    • 履歴データの収集スケジュールの確認と再スケジュールは,リアルタイムレポートの自動更新の際にも実行されます。

  • 表示要求から50秒以内にリアルタイムレポートを表示できなかった場合は,スケジュール過密のため,再スケジュール処理がタイムアウトとなります。

    • リアルタイムレポートが表示されない現象が続く場合は,しばらく時間を置いてから再実行してください。それでも表示されないときは,レコードの収集間隔を調整するか,または履歴レポートを使用することを検討してください。

    • 再スケジュール処理のタイムアウト時間とは別に,初期設定ファイル(config.xml)のreportFirstDataTimeoutで設定される,レポートの表示処理自体のタイムアウト時間も考慮する必要があります。この時間が60秒未満に設定されていると,再スケジュール時にタイムアウトが発生しやすくなります(デフォルト値:600秒)。reportFirstDataTimeoutの値を変更するか,再スケジュールがあまり発生しないように履歴データの収集スケジュールを調整してください。

(e) リアルタイムレポートを[一時保存モード]で表示する場合の動作

リアルタイムレポートを[一時保存モード]で表示する場合,通常のリアルタイムレポートの表示処理とは,次に示す違いがあります。

  • 表示時に使用されるのは,履歴データ収集の仕組みを使って一時保存されたデータです。

    • リアルタイムレポートとして表示しますが,内容は要求時点のものではなく,最後にデータを収集した時点のものとなります。一時保存データで表示する設定だとわかるように,レポートを表示する画面では上部に[一時保存モード]と表示され,jpcrptコマンドでは設定されているモードを示すメッセージが実行時に出力されます。

      なお,監視一時停止中であっても,リアルタイムレポート用の表示データの収集は継続して実施されます。

    • 収集した最新のデータはメモリー上に保存されるため,リアルタイムレポートを表示する監視エージェントのメモリー使用量が増加します。

      増加するメモリー使用量は,対象のレコードごとの使用メモリー量の総和となります。

      レコードごとの使用メモリー量は,次の見積もり式から算出できます。

      (レコードサイズの固定部※1+レコードサイズの可変部※1+20,000)×レコードのインスタンス数※2

      注※1 詳細は,対象のエージェントのマニュアルを参照してください。

      注※2 確認方法は,対象のエージェントのリリースノートを参照してください。

    • [一時保存モード]での収集処理は,対象のレコードのLogプロパティ(履歴データを収集するかどうか)の設定に関係なく実施されますが,Collection Intervalプロパティ(収集間隔)およびCollection Offsetプロパティ(オフセット値)の設定は適用されます。対象のレコードで収集間隔が「0」に設定されている場合はデータが収集されないため,リアルタイムレポートを表示できません。

  • 次に示す,レポートの表示設定の項目は無効となります。

    • デルタ値で表示するかどうか

      デルタ値が取得されるフィールド(「デルタ」欄が「Yes」のフィールド)については,常に前回収集時からのパフォーマンスデータの変化量で表示されます。

    • 更新間隔

      レポートの表示設定の内容に関係なく,レコードのCollection Intervalプロパティ(収集間隔)の設定値に従って更新されます。レポートを表示する画面では更新間隔を示す個所に「−」が表示されます。

  • 一時保存されたリアルタイムレポート用のデータは,サービスの停止時,およびRealtime Report Data Collection Modeプロパティの値の変更時に削除されます。

    • サービスを起動した直後やレコードのRealtime Report Data Collection Modeプロパティの値を変更した直後には,リアルタイムレポートが表示できないことがあります。この場合,収集処理が実施されるまで待ってから再実行してください。