JP1/Performance Management - Agent Option for Platform(UNIX(R)用)
監視するリソースごとに,ソリューションセット,およびソリューションセット以外の定義例について説明します。定義例の見方を次に示します。
- 定義例の■と□は,PFM - Web Consoleのチェックボックスを示しています。また,●と○は,PFM - Web Consoleのラジオボタンを示しています。
- 定義例の■と●は,PFM - Web Consoleでの設定で,チェックすることを示しています。また,□と○は,PFM - Web Consoleでの設定で,チェックしないことを示しています。
- 定義例の「xxx」「yyy」「zzz」「dummy」はユーザーがシステム環境に応じて変更する文字列です。そのほかの定義内容については,必要に応じて変更してください。
- 定義例の発生頻度(例:[ 3 ]回しきい値超過/[ 5 ]インターバル中)は,システム環境によって異なります。発生頻度の定義内容は,必要に応じて変更してください。例えば,システム環境で処理が集中する時間帯が2分以上で継続的な高負荷状態であるとします。このとき,収集間隔が60秒であれば,5回中2回までは許容範囲であり,3回以上で継続的な高負荷状態であるといえます。よって,発生頻度には「[ 3 ]回しきい値超過/[ 5 ]インターバル中」と設定します。
- <この項の構成>
- (1) プロセッサ
- (2) メモリー
- (3) ディスク
- (4) ネットワーク
- (5) プロセス
(1) プロセッサ
ソリューションセット,およびソリューションセット以外の定義例について説明します。
(a) ソリューションセット
・プロセッサの負荷状況の監視に関連するソリューションセットのアラーム
表1-8 プロセッサのソリューションセットのアラーム
ソリューションセットのアラーム名 使用レコード 使用フィールド 異常条件 警告条件 値の見方 Kernel CPU PI Kernel CPU % > 75 > 50 OS,運用方法に問題があるおそれがある。※ User CPU PI User CPU % > 85 > 65 特定のアプリケーションに問題があるおそれがある。※ Run Queue PI 5-Minute Run Queue Avg > 4 > 8 OS,運用方法,特定のアプリケーションに問題があるおそれがある。※
- 注※
- 過度にプロセッサを使用しているプロセスを見つけ,対策を立ててください。プロセスに問題がない場合,短期間に大量のプロセスが生成および消滅するなど,カーネルのスケジューリング処理が追いつかない運用をしているおそれがあります。その場合,限界を超えるシステム環境のため,プロセッサをアップグレードするか,プロセッサを追加するなどの対策を立ててください。
プロセッサの負荷状況を詳細に監視する場合,「1.3.2(1)(b) 監視方法」に示すアラームやレポートを作成し,既存アラームとあわせてに監視してください。
既存アラームの設定内容については「5. ソリューションセット」を参照してください。
・プロセッサに関連するソリューションセットのレポート
表1-9 プロセッサのソリューションセットのレポート
レポート名 表示する情報 CPU Per Processor Status プロセッサの状態についてのリアルタイム情報。 CPU Per Processor Usage プロセッサごとのCPU使用率についてのリアルタイム情報。 CPU Trend 最近1か月間の特定ホストのCPU使用率についての履歴情報(日単位)。 CPU Usage Summary 最近1時間のCPU使用率についての履歴情報(分単位)。 CPU Status(Multi-Agent) 最近24時間の複数ホストのCPU使用率についての履歴情報(時単位)。 CPU Status CPU使用率についてのリアルタイム情報。 CPU Trend(Multi-Agent) 最近1か月間の複数ホストのCPU使用率についての履歴情報(日単位)。 既存レポートの設定内容については「5. ソリューションセット」を参照してください。
(b) ソリューションセット以外の定義例
・プロセッサごとの使用率を監視するアラーム
表1-10 定義例
項目 内容 全般 プロダクト UNIX(6.0) アラームテーブル名 Alarm Example アラーム名 Kernel/User CPU メッセージテキスト Kernel/User mode CPU usage is %CVS2(%CVS1) 高度な設定 □ アラームを有効にする ■チェックする □ 常にアラーム通知する □チェックしない □ すべてのデータを評価する ■チェックする 監視時刻範囲
□ 常に監視する■チェックする 開始 − 終了 − 発生頻度
□ 発生頻度を満たした時にアラーム通知する■チェックする [ 2 ]回しきい値超過/[ 3 ]インターバル中 アラーム条件式 レコード PI_CPUP フィールド 異常条件:※
Processor ID <> "0"
AND System % > "75" または User % > "85"条件 異常値 警告値 警告条件:※
Processor ID <> "0"
AND System % > "50" または User % > "65"実行するアクション 任意で設定してください 異常 警告 正常 Eメール □ □ □ コマンド □ □ □ SNMP □ □ □ 表示するレポート [ ] PI_CPUPのレポートを指定する。
- (凡例)
- −:指定しない
- 注※
- メッセージテキストに値を表示するには,アラーム条件式にフィールドを設定してください。定義例では,Processor IDフィールドを必ず満たす条件値を設定しています。System %またはUser %には,監視したいフィールドを設定してください。
・ プロセッサ使用率が高いプロセスを確認するリアルタイムレポート
表1-11 定義例
項目 内容 名前と種別 レポート名 PD_PDI - Memory プロダクト UNIX(6.0) レポート種別 ○リアルタイム(一つのエージェント) ●チェックする ○履歴(一つのエージェント) − ○履歴(複数のエージェント) − フィールド レコード PD_PDI 選択されたフィールド Program
PDI
CPU %
System CPU
User CPUフィルター 条件式: ●拡張フィルター 条件式の定義 PID <> "0" 表示時に指定 □チェックしない 表示設定 □ 表示時に指定 ■チェックする □ デルタで表示 □チェックしない 更新間隔 □ 自動更新しない □チェックしない 初期値 30 最小値 30 ランキング表示 フィールド CPU % 表示数 10※ □ 降順 □チェックしない 表示形式 表 全フィールド 一覧 − グラフ System CPU
User CPU表示キー フィールド (なし) 降順 − グラフのプロパティ グラフの種類 積み上げ横棒 系列 行 軸ラベル X軸 プロセス名(プロセスID) Y軸 CPU 使用時間 データラベル データラベル1 プロセス名 データラベル2 プロセスID ドリルダウン レポートのドリルダウン 任意 フィールドのドリルダウン 任意
- (凡例)
- −:指定しない
- 注※
- 状況に応じて設定してください。
(2) メモリー
ソリューションセット,およびソリューションセット以外の定義例について説明します。
(a) ソリューションセット
・メモリーの利用効率の監視に関連するソリューションセットのアラーム
表1-12 メモリーのソリューションセットのアラーム
ソリューションセットのアラーム 使用レコード 使用フィールド 異常条件 警告条件 値の見方 Pagescans PI Page Scans/sec > 150 > 100 メモリーが不足しているおそれがある。 Swap Outs PI Swapped-Out Pages/sec > 200 > 100 メモリーが不足しているおそれがある。 既存アラームの設定内容については「5. ソリューションセット」を参照してください。
・メモリーに関連するソリューションセットのレポート
表1-13 メモリーのソリューションセットのレポート
レポート名 表示する情報 Memory Paging 最近1時間のメモリー使用状況についての履歴情報(分単位)。※ Memory Paging Status メモリーやページングについてのリアルタイム情報。※ Memory Paging Status (Multi-Agent) 最近24時間の複数ホストのメモリー使用状況についての履歴情報(時単位)。※ Paging Trend (Multi-Agent) 最近1か月間の複数ホストのページスキャンについての履歴情報(日単位)。※
- 注※
- Linuxの場合は,使用できません。
・システム(メモリー)に関連するソリューションセットのレポート
表1-14 システムのソリューションセットのレポート
レポート名 表示する情報 I/O Overview 最近1時間のI/O回数についての履歴情報(分単位)。Linuxの場合は,使用できない。 Process Trend 最近1か月間のプロセスの稼働数についての履歴情報(日単位)。 System Overview(システム稼働状況を示します。リアルタイムレポート) システムの稼働状況についてのリアルタイム情報。 System Overview(システム稼働状況を示します。履歴レポート) 最近1時間のシステムの稼働状況についての履歴情報(分単位)。 System Utilization Status システムの稼働状況についてのリアルタイム情報。 Workload Status システム負荷についてのリアルタイム情報。 Workload Status (Multi-Agent) 最近24時間の複数ホストのシステム負荷についての履歴情報(時単位)。 既存レポートの設定内容については「5. ソリューションセット」を参照してください。
(b) ソリューションセット以外の定義例
・メモリーの使用状況を監視するアラーム
表1-15 定義例
項目 内容 全般 プロダクト UNIX(6.0) アラームテーブル名 Alarm Example アラーム名 Alloc Mem Mbytes メッセージテキスト Alloc Mem Mbytes = %CVS1 □ 値の存在を監視するアラーム □チェックしない 高度な設定 □ アラームを有効にする ■チェックする □ 常にアラーム通知する □チェックしない □ すべてのデータを評価する □チェックしない 監視時刻範囲
□ 常に監視する■チェックする 開始 − 終了 − 発生頻度
□ 発生頻度を満たした時にアラーム通知する■チェックする [ 2 ]回しきい値超過/[ 3 ]インターバル中 アラーム条件式 レコード PI フィールド 異常条件:
Alloc Swap Mbytes >= "Total Swap Mbytes値の90%程度を設定する"条件 異常値 警告条件:
Alloc Swap Mbytes >= "Total Physical Mem Mbyteの値を設定する"警告値 実行するアクション 任意で設定してください 異常 警告 正常 Eメール □ □ □ コマンド □ □ □ SNMP □ □ □ 表示するレポート [ ] PIの履歴レポートを指定する。
- (凡例)
- −:指定しない
・プロセスのメモリー使用量を確認するリアルタイムレポート
表1-16 定義例
項目 内容 名前と種別 レポート名 PD_PDI - Memory プロダクト UNIX(6.0) レポート種別 ○リアルタイム(一つのエージェント) ●チェックする ○履歴(一つのエージェント) − ○履歴(複数のエージェント) − フィールド レコード PD_PDI 選択されたフィールド すべて選択する フィルター 条件式: ●拡張フィルター 条件式の定義 PID <> "0" 表示時に指定 □チェックしない 表示設定 □ 表示時に指定 ■チェックする □ デルタで表示 □チェックしない 更新間隔 □ 自動更新しない □チェックしない 初期値 30 最小値 30 ランキング表示 フィールド Virtual Mem Kbytes※1 表示数 30※2 □ 降順 ■チェックする 表示形式 表 Program
PID
Real Mem Kbytes
Virtual Mem Kbytes
Major Faults
Swaps
Context Switches
CPU %一覧 − グラフ Virtual Mem Kbytes
Real Mem Kbytes表示名 − 表示キー フィールド (なし) 降順 − グラフのプロパティ グラフの種類 折れ線 系列 行 軸ラベル X軸 時間 Y軸 メモリー使用量 データラベル データラベル1 (なし) データラベル2 (なし) ドリルダウン レポートのドリルダウン 任意 フィールドのドリルダウン 任意
- (凡例)
- −:指定しない
- 注※1
- 監視したいフィールドを設定します。
- 注※2
- 状況に応じて設定します。
(3) ディスク
ソリューションセット,およびソリューションセット以外の定義例について説明します。
(a) ソリューションセット
・ディスクのI/O状況の監視に関連するソリューションセットのアラーム
表1-17 ディスクのソリューションセットのアラーム
ソリューションセットのアラーム 使用レコード 使用フィールド 異常条件 警告条件 値の見方 I/O Wait Time PI Wait % > 80 > 60 データベースの更新など,I/Oに遅延が発生しているおそれがある。 Disk Service Time PI_DEVD Avg Service Time > 0.1 > 0.06 非常に大きなサイズのI/Oが発生しているおそれがある。 既存アラームの設定内容については「5. ソリューションセット」を参照してください。
・ディスクに関連するソリューションセットのレポート
表1-18 ディスクのソリューションセットのレポート
レポート名 表示する情報 Avg Service Time - Top 10 Devices 平均動作時間が長い上位10個のデバイスについてのリアルタイム情報。 Avg Service Time Status - Top 10 Devices 平均動作時間が長い10個のデバイスについてのリアルタイム情報。 Device Detail 選択したデバイスについてのリアルタイム情報。 Device Usage Status デバイスの使用状況についてのリアルタイム情報。 Device Usage Status (Multi-Agent) 最近24時間の複数ホストのデバイスの使用状況についての履歴情報(時単位)。 Free Space Mbytes - Top 10 Local File Systems 空き領域が少ない10個のローカルファイルシステムについてのリアルタイム情報。 Local File System Detail 選択したローカルファイルシステムについてのリアルタイム情報。 Remote File System Detail 選択したリモートファイルシステムについてのリアルタイム情報。 Space Usage - Top 10 Local File Systems 使用率が高いローカルファイルシステムの上位10個についてのリアルタイム情報。 Space Usage - Top 10 Remote File Systems 使用率が高いリモートファイルシステムの上位10個についてのリアルタイム情報。 NFS Activity Overview 最近1時間のNFSクライアントとNFSサーバの稼働状況についての履歴情報(分単位)。※ NFS Load Trend 最近1か月間のNFSクライアントとNFSサーバの稼働状況についての履歴情報(日単位)。※ NFS Usage Status NFSクライアントとNFSサーバの稼働状況についてのリアルタイム情報。※ NFS Usage Status (Multi-Agent) 最近24時間の複数ホストのNFSクライアントとNFSサーバの稼働状況についての履歴情報(時単位)。※
- 注※
- Linuxの場合は,使用できません。
既存レポートの設定内容については「5. ソリューションセット」を参照してください。
(b) ソリューションセット以外の定義例
・論理ディスクの未使用領域を監視するアラーム
表1-19 定義例
項目 内容 全般 プロダクト UNIX(6.0) アラームテーブル名 Alarm Example アラーム名 File System Free Mbytes メッセージテキスト Disk Space(%CVS1) = %CVS2 MB □ 値の存在を監視するアラーム □チェックしない 高度な設定 □ アラームを有効にする ■チェックする □ 常にアラーム通知する □チェックしない □ すべてのデータを評価する ■チェックする 監視時刻範囲
□ 常に監視する■チェックする 開始 − 終了 − 発生頻度
□ 発生頻度を満たした時にアラーム通知する□チェックしない − アラーム条件式 レコード PD_FSLまたはPD_FSR フィールド 異常条件:※
File System <> "dummy"
AND (Mbytes Free < "5120" )条件 異常値 警告値 警告条件:※
File System <> "dummy"
AND (Mbytes Free < "10240" )実行するアクション 任意で設定してください 異常 警告 正常 Eメール □ □ □ コマンド □ □ □ SNMP □ □ □ 表示するレポート [ ] PD_FSLまたはPD_FSRの履歴レポートを指定する。
- (凡例)
- −:指定しない
- 注※
- メッセージテキストに値を表示するには,アラーム条件式にフィールドを設定してください。定義例では,File Systemフィールドを必ず満たす条件値を設定しています。
・ディスクのビジー率を監視するアラーム
表1-20 定義例
項目 内容 全般 プロダクト UNIX(6.0) アラームテーブル名 Alarm Example アラーム名 Disk Busy % メッセージテキスト Disk Busy % (%CVS1) = %CVS2 □ 値の存在を監視するアラーム □チェックしない 高度な設定 □ アラームを有効にする ■チェックする □ 常にアラーム通知する □ □ すべてのデータを評価する ■チェックする 監視時刻範囲
□ 常に監視する■チェックする 開始 − 終了 − 発生頻度
□ 発生頻度を満たした時にアラーム通知する■チェックする [ 4 ]回しきい値超過/[ 5 ]インターバル中 アラーム条件式 レコード PI_DEVD フィールド 異常条件:※
Device Name <> "dummy"
AND (Busy % >= "90" )条件 異常値 警告値 警告条件:※
Device Name <> "dummy"
AND (Busy % >= "80" )実行するアクション 任意で設定してください 異常 警告 正常 Eメール □ □ □ コマンド □ □ □ SNMP □ □ □ 表示するレポート [ ] PI_DEVDのレポートを指定する。
- (凡例)
- −:指定しない
- 注※
- メッセージテキストに値を表示するには,アラーム条件式にフィールドを設定してください。定義例では,Device Nameフィールドを必ず満たす条件値を設定しています。
・ディスクの混雑を監視するアラーム
表1-21 定義例
項目 内容 全般 プロダクト UNIX(6.0) アラームテーブル名 Alarm Example アラーム名 Disk Queue メッセージテキスト Disk Queue(%CVS1) = %CVS2 □ 値の存在を監視するアラーム □チェックしない 高度な設定 □ アラームを有効にする ■チェックする □ 常にアラーム通知する □ □ すべてのデータを評価する ■チェックする 監視時刻範囲
□ 常に監視する■チェックする 開始 − 終了 − 発生頻度
□ 発生頻度を満たした時にアラーム通知する■チェックする [ 4 ]回しきい値超過/[ 5 ]インターバル中 アラーム条件式 レコード PI_DEVD フィールド 異常条件:※
Device Name <> "dummy"
AND (Queue Length >= "5" )条件 異常値 警告値 警告条件:※
Device Name <> "dummy"
AND (Queue Length >= "3" )実行するアクション 任意で設定してください 異常 警告 正常 Eメール □ □ □ コマンド □ □ □ SNMP □ □ □ 表示するレポート [ ] PI_DEVDのレポートを指定する。
- (凡例)
- −:指定しない
- 注※
- メッセージテキストに値を表示するには,アラーム条件式にフィールドを設定してください。定義例では,Device Nameフィールドを必ず満たす条件値を設定しています。
(4) ネットワーク
ソリューションセット,およびソリューションセット以外の定義例について説明します。
(a) ソリューションセット
・ネットワークに関連するソリューションセットのアラーム
なし
・ネットワークに関連するソリューションセットのレポート
表1-22 ネットワークのソリューションセットのレポート
レポート名 表示する情報 Network Interface Detail 選択したシステムのネットワーク使用状況についてのリアルタイム情報。 Network Interface Summary(ネットワーク使用状況を示します。リアルタイムレポート) ネットワーク使用状況についてのリアルタイム情報。 Network Interface Summary(ネットワーク使用状況を示します。履歴レポート) 最近1時間のネットワーク使用状況についての履歴情報(分単位)。 Network Overview 最近1時間のネットワーク使用状況についての履歴情報(分単位)。 Network Status (Multi-Agent) 最近24時間の複数ホストのネットワーク使用状況についての履歴情報(時単位)。 Network Status ネットワーク使用状況についてのリアルタイム情報。 既存レポートの設定内容については「5. ソリューションセット」を参照してください。
(b) ソリューションセット以外の定義例
・ネットワークインターフェースカードに帯域幅(一定時間内に転送できるデータの量)を超えるデータ受信がないか監視するアラーム
表1-23 定義例
項目 内容 全般 プロダクト UNIX(6.0) アラームテーブル名 Alarm Example アラーム名 Network Rcvd/Xmitd メッセージテキスト NIC Rcvd/Xmitd = %CVS1 □ 値の存在を監視するアラーム □チェックしない 高度な設定 □ アラームを有効にする ■チェックする □ 常にアラーム通知する □チェックしない □ すべてのデータを評価する □チェックしない 監視時刻範囲
□ 常に監視する■チェックする 開始 − 終了 − 発生頻度
□ 発生頻度を満たした時にアラーム通知する■チェックする [ 4 ]回しきい値超過/[ 5 ]インターバル中 アラーム条件式 レコード PI_NINS フィールド 異常条件:※
Pkts Rcvd/sec >= "NICの帯域幅の90%程度を設定する"条件 異常値 警告値 警告条件:※
Pkts Rcvd/sec >= "NICの帯域幅の80%程度を設定する"実行するアクション 任意で設定してください 異常 警告 正常 Eメール □ □ □ コマンド □ □ □ SNMP □ □ □ 表示するレポート [ ] PI_NINDの履歴レポートを指定する。
- (凡例)
- −:指定しない
- 注※
- NICごとの送受信を監視したい場合,PI_NINDレコードPkts Rcvd/secフィールドまたはPkts Xmitd/secフィールドを設定してください。PI_NINDレコードは複数インスタンスレコードのため,「すべてのデータを評価する」をチェックしてください。
(5) プロセス
ソリューションセット,およびソリューションセット以外の定義例について説明します。
(a) ソリューションセット
・プロセスに関連するソリューションセットのアラーム
なし
・プロセスに関連するソリューションセットのレポート
表1-24 プロセスのソリューションセットのレポート
レポート名 表示する情報 CPU Usage - Top 10 Processes CPU使用率上位10個のプロセスについてのリアルタイム情報。 I/O Activity - Top 10 Processes I/O処理数上位10個のプロセスについてのリアルタイム情報。HP-UX,AIX,Linuxの場合は,使用できない。 Major Page Faults - Top 10 Processes 物理的なI/Oを引き起こすページフォルト数上位10個のプロセスについてのリアルタイム情報。 Process Detail 選択したホストのプロセスについてのリアルタイム情報。 Process Overview 最近1時間のプロセスの稼働状況についての履歴情報(分単位)。 Process Summary Status プロセスの稼働状況についてのリアルタイム情報。 既存レポートの設定内容については「5. ソリューションセット」を参照してください。
(b) ソリューションセット以外の定義例
・プロセスの消滅を監視するアラーム
表1-25 定義例
項目 内容 全般 プロダクト UNIX(6.0) アラームテーブル名 Alarm Example アラーム名 xxx Process Exit メッセージテキスト xxx プロセスが実行されていません □値の存在を監視するアラーム ■チェックする 高度な設定 □ アラームを有効にする ■チェックする □ 常にアラーム通知する □チェックしない □ すべてのデータを評価する □チェックしない 監視時刻範囲
□ 常に監視する■チェックする 開始 − 終了 − 発生頻度
□ 発生頻度を満たした時にアラーム通知する□チェックしない − アラーム条件式 レコード PD_PDI フィールド Program 値 プロセス名を入力 実行するアクション 任意で設定してください 異常 警告 正常 Eメール □ □ □ コマンド □ □ □ SNMP □ □ □ 表示するレポート [ ] PD_PDIのリアルタイムレポートを指定する。
- (凡例)
- −:指定しない
・プロセスの生成を監視するアラーム
/opt/jp1pc/agtu/agent/wgfileの定義例を次に示します。
workgroup=xxx Application Processes programs=yyy,zzz
- 注意
- wgfileファイルは,PFM - Agent for Platformインストール環境で設定してください。wgfileファイルの設定方法については,「4.2.1 ワークグループ情報の収集の設定」を参照してください。
- プログラム名は,ps -elコマンドで出力されるプロセス名を指定してください。または,PDレコードProgramフィールドに格納される値を指定してください。プロセス名がyyyおよびzzzの定義例を示しています。
表1-26 定義例
項目 内容 全般 プロダクト UNIX(6.0) アラームテーブル名 Alarm Example アラーム名 xxx Application Processes メッセージテキスト xxx Application Process Count = %CVS1 □値の存在を監視するアラーム □チェックしない 高度な設定 □ アラームを有効にする ■チェックする □ 常にアラーム通知する □チェックしない □ すべてのデータを評価する □チェックしない 監視時刻範囲
□ 常に監視する■チェックする 開始 − 終了 − 発生頻度
□ 発生頻度を満たした時にアラーム通知する□チェックしない − アラーム条件式 レコード PI_WGRP フィールド 異常条件:※
Process Count > "0"
AND ( Workgroup = "xxx Application Processes" )条件 異常値 警告値 警告条件:※
Process Count > "0"
AND ( Workgroup = "xxx Application Processes" )実行するアクション 任意で設定してください 異常 警告 正常 Eメール □ □ □ コマンド □ □ □ SNMP □ □ □ 表示するレポート [ ] PD_PDIのリアルタイムレポートを指定する。
- (凡例)
- −:指定しない
- 注※
- 条件式を変更することで,プロセスの消滅(Process Count = "0")や,アプリケーションに必要な起動プロセス数(プロセスが3必要なとき:Process Count < "3")の監視もできます。
All Rights Reserved. Copyright (C) 2006, 2008, Hitachi, Ltd.