8.2.5 パフォーマンスデータの収集と管理について
Performance Managementのパフォーマンスデータの収集と管理に関するトラブルの対処方法を次に示します。
- <この項の構成>
- (1) データの保存期間を短く設定しても,PFM - RM for PlatformのStoreデータベースのサイズが小さくならない
- (2) 共通メッセージログに「Storeデータベースに不正なデータが検出されました」というメッセージが出力される
- (3) PFM - RM for Platformを起動してもパフォーマンスデータが収集されない
- (4) プロセス監視に関するアラームが意図したとおりに通知されない
(1) データの保存期間を短く設定しても,PFM - RM for PlatformのStoreデータベースのサイズが小さくならない
Storeデータベースのファイル容量がすでに限界に達している場合,データの保存期間を短く設定してもファイルサイズは小さくなりません。この場合,保存期間を短く設定したあと,いったんStoreデータベースをバックアップし,リストアし直してください。
データの保存期間の設定方法については,マニュアル「JP1/Performance Management 運用ガイド」の稼働監視データの管理について説明している章を参照してください。また,Storeデータベースのバックアップとリストアの方法については,マニュアル「JP1/Performance Management 運用ガイド」のバックアップとリストアについて説明している章を参照してください。
(2) 共通メッセージログに「Storeデータベースに不正なデータが検出されました」というメッセージが出力される
予期しないサービスの停止またはマシンのシャットダウンによって,Storeデータベースに不整合なデータが発生したおそれがあります。次の方法で対処してください。
- Storeデータベースをバックアップしている場合は,Storeデータベースをリストアしてください。
- Storeデータベースをバックアップしていない場合は,Remote Monitor Storeサービスを停止したあと,対応するデータベースファイル(*.DBファイルおよび*.IDXファイル)を削除し,サービスを再起動してください。
(3) PFM - RM for Platformを起動してもパフォーマンスデータが収集されない
PDレコードのStatusフィールドの値がERRORの場合は,Reasonフィールドの値によって対処してください。
Reasonフィールドに出力される値ごとに,確認内容を説明します。
(a) Connection failed:監視対象ホストへの接続に失敗しました。
- <監視対象ホストがWindowsの場合>
- 監視対象ホストが起動されているか
- 監視対象ホストでWMIサービスが起動されているか
- 監視対象のセットアップ時に設定した次の項目に誤りがないか※1
・TargetHost
- 監視対象のセットアップ時に設定したホスト名(TargetHost)で名前解決ができるか
- インスタンス環境のセットアップ時に設定した次の項目に誤りがないか※2
・SSH_Client
・Perl_Module
- 次のWMI接続用設定手順を正しく実施しているか
・PFM - RMホストでのDCOMの設定
・監視対象ホストでのWMIの名前空間の設定
・監視対象ホストでのファイアウォールの設定
- ファイアウォールを挟んでPFM - RM for Platformと監視対象を配置している場合,ファイアウォールの通過ポートが適切に設定されているか
- <監視対象ホストがUNIXの場合>
- 監視対象ホストが起動されているか
- 監視対象ホストでSSHサーバが起動されているか
- 監視対象ホストのセットアップ時に設定した次の項目に誤りがないか※1
・Target Host
・Port
・User
・PrivateKeyFile
- 監視対象のセットアップ時に設定したホスト名(Target Host)で名前解決ができるか
- SSH接続用設定手順を正しく実施しているか
- ファイアウォールを挟んでPFM - RM for Platformと監視対象を配置している場合,ファイアウォールの通過ポートが適切に設定されているか
- 注※1
- 設定した項目を確認するには,jpcconf target setupコマンドを実行し,設定項目を確認してください。または,PFM - Web ConsoleでPFM - RM for PlatformのRemote Monitor CollectorサービスからRemote Monitor Configurationプロパティを参照して,設定項目を確認してください。
- 注※2
- 設定した項目を確認するには,jpcconf inst setupコマンドを実行し,設定項目を確認してください。または,PFM - Web ConsoleでPFM - RM for PlatformのRemote Monitor CollectorサービスからRemote Monitor Configurationプロパティを参照して,設定項目を確認してください。
(b) Authorization failed:監視対象ホストで認証に失敗しました。
Windowsの場合の確認内容を次に示します。UNIXの場合は該当しません。
- <監視対象ホストがWindowsの場合>
- 監視対象のセットアップ時に設定した次の項目に誤りがないか※
・User
・Password
・Domain
- 次のWMI接続用設定手順を正しく実施しているか
・PFM - RMホストでのDCOMの設定
・監視対象ホストでのDCOMの設定
- 注※
- 設定した項目を確認するには,jpcconf target setupコマンドを実行し,設定項目を確認してください。または,PFM - Web ConsoleでPFM - RM for PlatformのRemote Monitor CollectorサービスからRemote Monitor Configurationプロパティを参照して,設定項目を確認してください。
(c) Invalid environment(SSH_Client):インスタンス環境の設定でSSH_Clientに指定したファイルが存在しません(PFM - RMホストがWindowsで監視対象ホストがUNIXの場合)。
PFM - RMホストがWindowsで監視対象ホストがUNIXの場合の確認内容を次に示します。監視対象ホストがWindowsの場合,PFM - RMホストがUNIXの場合は該当しません。
- インスタンス環境のセットアップ時に設定した次の項目に誤りがないか※
SSH_Client
- 注※
- 設定した項目を確認するには,jpcconf inst setupコマンドを実行し,設定項目を確認してください。または,PFM - Web ConsoleでPFM - RM for PlatformのRemote Monitor CollectorサービスからRemote Monitor Configurationプロパティを参照して,設定項目を確認してください。
(d) Invalid environment(Perl_Module):インスタンス環境の設定でPerl_Moduleに指定したファイルが存在しません(PFM - RMホストがWindowsで監視対象ホストがUNIXの場合)。
PFM - RMホストがWindowsで監視対象ホストがUNIXの場合の確認内容を次に示します。監視対象ホストがWindowsの場合,PFM - RMホストがUNIXの場合は該当しません。
- インスタンス環境のセットアップ時に設定した次の項目に誤りがないか※
Perl_Module
- 注※
- 設定した項目を確認するには,jpcconf inst setupコマンドを実行し,設定項目を確認してください。または,PFM - Web ConsoleでPFM - RM for PlatformのRemote Monitor CollectorサービスからRemote Monitor Configurationプロパティを参照して,設定項目を確認してください。
(e) Invalid environment(Private_Key_File):監視対象ホストの設定でPrivate_Key_Fileに指定したファイルが存在しません(PFM - RMホストがWindowsで監視対象ホストがUNIXの場合)。
PFM - RMホストがWindowsで監視対象ホストがUNIXの場合の確認内容を次に示します。監視対象ホストがWindowsの場合,PFM - RMホストがUNIXの場合は該当しません。
- インスタンス環境のセットアップ時に設定した次の項目に誤りがないか※
Private_Key_File
- 注※
- 設定した項目を確認するには,jpcconf target setupコマンドを実行し,設定項目を確認してください。または,PFM - Web ConsoleでPFM - RM for PlatformのRemote Monitor CollectorサービスからRemote Monitor Configurationプロパティを参照して,設定項目を確認してください。
(f) 上記以外の値
- 保守資料を採取したあと,システム管理者に連絡してください。
- 監視対象ホストがWindowsの場合,アプリケーションイベントログを確認して対処してください。
PFM - RM for Platformで次のレコードのパフォーマンスデータを収集する場合,パフォーマンスコンソール※上でオブジェクトがモニタリングできる状態である必要があります。各レコードに対応するオブジェクト,イベントログに出力されるソース(サービス)名,およびパフォーマンス拡張DLLを次の表に示します。
- 注※
各レコードに対応するオブジェクトの名称は,「パフォーマンス」で確認できます。対応するオブジェクトが存在しない場合,Microsoft社が提供しているMicrosoft Knowledge Baseで公開されている手順に従って,モニタリングできる状態にしてください。
表8-2 各レコードに対応するオブジェクト,イベントログに出力されるソース(サービス)名,およびパフォーマンス拡張DLL
項番 | カテゴリー | レコード名(レコードID) | オブジェクト名 | イベントログに出力されるソース(サービス)名 | パフォーマンス拡張DLL |
---|
1 | ディスク | Logical Disk Overview(PI_LDSK) | LogicalDisk | WinMgmt | perfdisk.dll |
2 | Physical Disk Overview(PI_PDSK) | PhysicalDisk |
3 | ネットワーク関連 | Network Interface Overview(PI_NET) | Network Interface | perfctrs.dll |
4 | OS全般(プロセッサ,メモリーなど) | System Overview(PI) | Memory | perfos.dll |
5 | System |
6 | Processor |
7 | Processor Overview(PI_CPU) | Processor |
また,アプリケーションイベントログにWinMgmt名が記録されている場合,PFM - RM for Platformが正常に動作しないことや,そのソース(サービス)に対応するレコードが収集できないことがあります。次の表に示すようなアプリケーションイベントログが記録されている場合,ソース(サービス)を再インストールするか,Microsoft社が提供しているMicrosoft Knowledge Baseに公開されている原因を取り除くか,またはソース(サービス)の開発元に対処方法を問い合わせて,アプリケーションイベントログが記録されない環境に修復してください。
PFM - RM for Platformが正常に動作しない場合や,そのソース(サービス)に対応するレコードが収集できない場合のアプリケーションイベントログの一例を次の表に示します。
表8-3 レコードが正常に収集されない場合のアプリケーションイベントログの例
項番 | イベントID | ソース(サービス)名 | イベントログの内容 |
---|
1 | 37 | WinMgmt | ライブラリー内で不明な問題が発生したため,WMI ADAP 0x0はファイル名パフォーマンスライブラリーを読み込むことができませんでした。 |
2 | 41 | 009サブキーで値が見つからなかったため,WMI ADAPはパフォーマンスライブラリーサービス名のオブジェクトインデックスnを作成しませんでした。 |
3 | 61 | open関数で時間違反があったため,WMI ADAPはファイル名パフォーマンスライブラリーを処理できませんでした。 |
- 監視対象がUNIXの場合,dfコマンドを正常に実行できるかどうかを確認して,回復手段を実施してください。
監視対象がUNIXの場合,PFM - RM for Platformは,dfコマンドが正常に実行できて,マウントしているリモートファイルシステムの情報が参照できる状態で運用する必要があります。dfコマンドが正常に実行できず,マウントしているリモートファイルシステムが応答を返さない状態で,インスタンス環境の設定項目「Disk_Category」に「Y」を指定すると,Remote Agentサービスがパフォーマンスデータを正しく収集できなくなります。この場合,次の方法で対処してください。
- インスタンス環境の設定項目「Disk_Category」の指定値を「N」に変更する。
- 次のどちらかのコマンドを実行して,監視対象に指定したリモートホスト上のdfプロセスを停止する。
・kill -TERM dfのプロセスID
・kill dfのプロセスID
- NFSデーモンを再起動するなどして,リモートファイルシステムが正常にマウントされている状態にする。
- インスタンス環境の設定項目「Disk_Category」の指定値を「Y」に戻す。
(4) プロセス監視に関するアラームが意図したとおりに通知されない
監視対象ホストがUNIXの場合,プロセスの稼働・非稼働を監視するときに,監視対象プロセスを停止していなくても異常アラームが通知されて,次の収集時間に正常アラームが通知されることがあります。
UNIX環境では,プロセスが子プロセスを生成する過程で,プロセスのコピーが作成されるため,同じプロセスが複数あるように見えることがあります。そのため,子プロセスを生成するプロセスを監視対象とするときは,プロセス数が増加することを考慮してください。具体的には,プロセス数が増えたタイミングでプロセスの情報が収集されると異常アラームが通知され,プロセス数が一つに戻ったタイミングでプロセスの情報が収集されると正常アラームが通知されるという現象が起こります。
この現象を回避するために,次の設定をして運用してください。
- 監視対象のプロセスから生成される子プロセスについて,同時に存在する最大数が明確なときは,監視対象対象プロセス数の上限のしきい値に,次の計算結果を指定してください。プロセスの最大起動数をm,プロセス1個ごとに同時に存在する子プロセスの最大数をnとします。
m * (1 + n)
ただし,計算結果が「65535」を超えたら,「65535」を設定してください。
- 監視対象のプロセスから生成される子プロセスについて,同時に存在するプロセスの最大数が不明なときは,監視対象対象プロセス数の上限のしきい値に,「65535」を設定してください。
また,プロセスの稼働・非稼働情報をOSから収集できなかった場合,監視対象プロセス数が0個となって,アラームが通知されることがあります。このアラームの通知を防ぐために,[アラーム階層]画面から[新規アラーム > 基本情報]画面または[編集 > 基本情報]画面を開いて,[高度な設定]で[発生頻度を満たした時にアラーム通知する]をチェックし,[2回しきい値超過/インターバル中]と設定してください。