JP1/Performance Management - Agent Option for Platform(UNIX(R)用)
監視するリソースごとに,監視テンプレート,および監視テンプレート以外の定義例について説明します。定義例の見方を次に示します。
- 定義例の■と□は,PFM - Web Consoleのチェックボックスを示しています。また,●と○は,PFM - Web Consoleのラジオボタンを示しています。
- 定義例の■と●は,PFM - Web Consoleでの設定で,チェックすることを示しています。また,□と○は,PFM - Web Consoleでの設定で,チェックしないことを示しています。
- 定義例の「xxx」「yyy」「zzz」「dummy」はユーザーがシステム環境に応じて変更する文字列です。そのほかの定義内容については,必要に応じて変更してください。
- 定義例の発生頻度(例:[ 3 ]回しきい値超過/[ 5 ]インターバル中)は,システム環境によって異なります。発生頻度の定義内容は,必要に応じて変更してください。例えば,システム環境で処理が集中する時間帯が2分以上で継続的な高負荷状態であるとします。このとき,収集間隔が60秒であれば,5回中2回までは許容範囲であり,3回以上で継続的な高負荷状態であるといえます。よって,発生頻度には「[ 3 ]回しきい値超過/[ 5 ]インターバル中」と設定します。
- <この項の構成>
- (1) プロセッサ
- (2) メモリー
- (3) ディスク
- (4) ネットワーク
- (5) プロセス
(1) プロセッサ
監視テンプレート,および監視テンプレート以外の定義例について説明します。
(a) 監視テンプレート
・プロセッサに関連する監視テンプレートのアラーム
プロセッサに関連する監視テンプレートのアラームは,PFM UNIX Template Alarms [CPU] 09.00アラームテーブルに格納されています。
表1-8 プロセッサの監視テンプレートのアラーム
監視テンプレートのアラーム名 使用レコード 使用フィールド 異常条件 警告条件 値の見方 Kernel CPU PI Kernel CPU % > 75 > 50 動作している時間の割合が継続してしきい値より大きい場合,OS,運用方法に問題があるおそれがある。※ User CPU PI User CPU % > 85 > 65 動作している時間の割合が継続してしきい値より大きい場合,特定のアプリケーションに問題があるおそれがある。※ Run Queue PI 5-Minute Run Queue Avg > 8 > 4 スレッド数の平均がしきい値より大きい場合,OS,運用方法,特定のアプリケーションに問題があるおそれがある。※ CPU Per Processor(K) PI_CPUP Processor ID >= 0 >= 0 CPU使用率が継続してしきい値以上の場合,OSまたは運用方法に問題があるおそれがある。 System % > 75 > 50 CPU Per Processor(U) PI_CPUP Processor ID >= 0 >= 0 CPU使用率が継続してしきい値以上の場合,特定のアプリケーションに問題があるおそれがある。 User % > 85 > 65
- 注※
- 過度にプロセッサを使用しているプロセスを見つけ,対策を立ててください。プロセスに問題がない場合,短期間に大量のプロセスが生成および消滅するなど,カーネルのスケジューリング処理が追いつかない運用をしているおそれがあります。その場合,限界を超えるシステム環境のため,プロセッサをアップグレードするか,プロセッサを追加するなどの対策を立ててください。
プロセッサの負荷状況を詳細に監視する場合,「1.3.2(1)(b) 監視方法」に示すアラームやレポートを作成し,既存アラームとあわせて監視してください。
既存アラームの設定内容については「5. 監視テンプレート」を参照してください。
・プロセッサに関連する監視テンプレートのレポート
表1-9 プロセッサの監視テンプレートのレポート
レポート名 表示する情報 CPU Per Processor Status プロセッサの状態についてのリアルタイム情報。 CPU Per Processor Usage プロセッサごとのCPU使用率についてのリアルタイム情報。 CPU Trend 最近1か月間の特定ホストのCPU使用率についての履歴情報(日単位)。 CPU Usage Summary 最近1時間のCPU使用率についての履歴情報(分単位)。 CPU Status(Multi-Agent) 最近24時間の複数ホストのCPU使用率についての履歴情報(時単位)。 CPU Status CPU使用率についてのリアルタイム情報。 CPU Trend(Multi-Agent) 最近1か月間の複数ホストのCPU使用率についての履歴情報(日単位)。 既存レポートの設定内容については「5. 監視テンプレート」を参照してください。
(b) 監視テンプレート以外の定義例
・ プロセッサ使用率が高いプロセスを確認するリアルタイムレポート
表1-10 定義例
項目 内容 名前と種別 レポート名 PD_PDI - Memory プロダクト UNIX (6.0) レポート種別 ○リアルタイム(一つのエージェント) ●チェックする ○履歴(一つのエージェント) − ○履歴(複数のエージェント) − フィールド レコード PD_PDI 選択されたフィールド Program
PDI
CPU %
System CPU
User CPUフィルター 条件式: ●拡張フィルター 条件式の定義 PID <> "0" 表示時に指定 □チェックしない 表示設定 □ 表示時に指定 ■チェックする □ デルタで表示 □チェックしない 更新間隔 □ 自動更新しない □チェックしない 初期値 30 最小値 30 ランキング表示 フィールド CPU % 表示数 10※ □ 降順 □チェックしない 表示形式 表 全フィールド 一覧 − グラフ System CPU
User CPU表示キー フィールド (なし) 降順 − グラフのプロパティ グラフの種類 積み上げ横棒 系列 行 軸ラベル X軸 プロセス名(プロセスID) Y軸 CPU 使用時間 データラベル データラベル1 プロセス名 データラベル2 プロセスID ドリルダウン レポートのドリルダウン 任意 フィールドのドリルダウン 任意
- (凡例)
- −:指定しない
- 注※
- 状況に応じて設定してください。
(2) メモリー
監視テンプレート,および監視テンプレート以外の定義例について説明します。
(a) 監視テンプレート
・メモリーに関連する監視テンプレートのアラーム
メモリーに関連する監視テンプレートのアラームは,PFM UNIX Template Alarms [MEM] 09.00アラームテーブルに格納されています。
表1-11 メモリーの監視テンプレートのアラーム
監視テンプレートのアラーム 使用レコード 使用フィールド 異常条件 警告条件 値の見方 Pagescans PI Page Scans/sec > 150 > 100 発生した回数がしきい値より多い場合,メモリーが不足しているおそれがある。 Swap Outs PI Swapped-Out Pages/sec > 200 > 100 ページ数がしきい値より多い場合,メモリーが不足しているおそれがある。 Alloc Mem Mbytes PI Alloc Swap Mbytes >= 1800 >= 1024 使用量が継続してしきい値(PIレコードのTotal Physical Mem Mbytesフィールド)以上の場合,物理メモリーが不足しているおそれがある。 既存アラームの設定内容については「5. 監視テンプレート」を参照してください。
・メモリーに関連する監視テンプレートのレポート
表1-12 メモリーの監視テンプレートのレポート
レポート名 表示する情報 Memory Paging 最近1時間のメモリー使用状況についての履歴情報(分単位)。※ Memory Paging Status メモリーやページングについてのリアルタイム情報。※ Memory Paging Status (Multi-Agent) 最近24時間の複数ホストのメモリー使用状況についての履歴情報(時単位)。※ Paging Trend (Multi-Agent) 最近1か月間の複数ホストのページスキャンについての履歴情報(日単位)。※
- 注※
- Linuxの場合は,使用できません。
・システム(メモリー)に関連する監視テンプレートのレポート
表1-13 システムの監視テンプレートのレポート
レポート名 表示する情報 I/O Overview 最近1時間のI/O回数についての履歴情報(分単位)。Linuxの場合は,使用できない。 Process Trend 最近1か月間のプロセスの稼働数についての履歴情報(日単位)。 System Overview(システム稼働状況を示すリアルタイムレポート) システムの稼働状況についてのリアルタイム情報。 System Overview(システム稼働状況を示す履歴レポート) 最近1時間のシステムの稼働状況についての履歴情報(分単位)。 System Utilization Status システムの稼働状況についてのリアルタイム情報。 Workload Status システム負荷についてのリアルタイム情報。 Workload Status (Multi-Agent) 最近24時間の複数ホストのシステム負荷についての履歴情報(時単位)。 既存レポートの設定内容については「5. 監視テンプレート」を参照してください。
(b) 監視テンプレート以外の定義例
・プロセスのメモリー使用量を確認するリアルタイムレポート
表1-14 定義例
項目 内容 名前と種別 レポート名 PD_PDI - Memory プロダクト UNIX (6.0) レポート種別 ○リアルタイム(一つのエージェント) ●チェックする ○履歴(一つのエージェント) − ○履歴(複数のエージェント) − フィールド レコード PD_PDI 選択されたフィールド すべて選択する フィルター 条件式: ●拡張フィルター 条件式の定義 PID <> "0" 表示時に指定 □チェックしない 表示設定 □ 表示時に指定 ■チェックする □ デルタで表示 □チェックしない 更新間隔 □ 自動更新しない □チェックしない 初期値 30 最小値 30 ランキング表示 フィールド Virtual Mem Kbytes※1 表示数 30※2 □ 降順 ■チェックする 表示形式 表 Program
PID
Real Mem Kbytes
Virtual Mem Kbytes
Major Faults
Swaps
Context Switches
CPU %一覧 − グラフ Virtual Mem Kbytes
Real Mem Kbytes表示名 − 表示キー フィールド (なし) 降順 − グラフのプロパティ グラフの種類 折れ線 系列 行 軸ラベル X軸 時間 Y軸 メモリー使用量 データラベル データラベル1 (なし) データラベル2 (なし) ドリルダウン レポートのドリルダウン 任意 フィールドのドリルダウン 任意
- (凡例)
- −:指定しない
- 注※1
- 監視したいフィールドを設定します。
- 注※2
- 状況に応じて設定します。
(3) ディスク
監視テンプレートの定義例について説明します。
(a) 監視テンプレート
・ディスクに関連する監視テンプレートのアラーム
ディスクに関連する監視テンプレートのアラームは,PFM UNIX Template Alarms [DSK] 09.00アラームテーブルに格納されています。
表1-15 ディスクの監視テンプレートのアラーム
監視テンプレートのアラーム 使用レコード 使用フィールド 異常条件 警告条件 値の見方 I/O Wait Time PI Wait % > 80 > 60 I/O待ちの状態だった時間の割合がしきい値より大きい場合,データベースの更新など,I/Oに遅延が発生しているおそれがある。 Disk Service Time PI_DEVD Avg Service Time > 0.1 > 0.06 平均動作時間がしきい値より長い場合,非常に大きなサイズのI/Oが発生しているおそれがある。 File System Free(L) PD_FSL File System <> dummy <> dummy 未使用領域が少ない場合,ディスク容量が不足していることを示す。 Mbytes Free < 5120 < 10240 File System Free(R) PD_FSR File System <> dummy <> dummy 未使用領域が少ない場合,ディスク容量が不足していることを示す。 Mbytes Free < 5120 < 10240 Disk Busy % PI_DEVD Device Name <> dummy <> dummy ビジー率の割合が継続してしきい値以上の場合,I/Oが特定のディスクに集中しているおそれがある。 Busy % >= 90 >= 80 Disk Queue PI_DEVD Device Name <> dummy <> dummy キューの長さが継続してしきい値以上の場合,デバイスの混雑を示す。 Queue Length >= 5 >= 3 既存アラームの設定内容については「5. 監視テンプレート」を参照してください。
・ディスクに関連する監視テンプレートのレポート
表1-16 ディスクの監視テンプレートのレポート
レポート名 表示する情報 Avg Service Time - Top 10 Devices 平均動作時間が長い上位10個のデバイスについてのリアルタイム情報。 Avg Service Time Status - Top 10 Devices 平均動作時間が長い10個のデバイスについてのリアルタイム情報。 Device Detail 選択したデバイスについてのリアルタイム情報。 Device Usage Status デバイスの使用状況についてのリアルタイム情報。 Device Usage Status (Multi-Agent) 最近24時間の複数ホストのデバイスの使用状況についての履歴情報(時単位)。 Free Space Mbytes - Top 10 Local File Systems 空き領域が少ない10個のローカルファイルシステムについてのリアルタイム情報。 Local File System Detail 選択したローカルファイルシステムについてのリアルタイム情報。 Remote File System Detail 選択したリモートファイルシステムについてのリアルタイム情報。 Space Usage - Top 10 Local File Systems 使用率が高いローカルファイルシステムの上位10個についてのリアルタイム情報。 Space Usage - Top 10 Remote File Systems 使用率が高いリモートファイルシステムの上位10個についてのリアルタイム情報。 NFS Activity Overview 最近1時間のNFSクライアントとNFSサーバの稼働状況についての履歴情報(分単位)。※ NFS Load Trend 最近1か月間のNFSクライアントとNFSサーバの稼働状況についての履歴情報(日単位)。※ NFS Usage Status NFSクライアントとNFSサーバの稼働状況についてのリアルタイム情報。※ NFS Usage Status (Multi-Agent) 最近24時間の複数ホストのNFSクライアントとNFSサーバの稼働状況についての履歴情報(時単位)。※
- 注※
- Linuxの場合は,使用できません。
既存レポートの設定内容については「5. 監視テンプレート」を参照してください。
(4) ネットワーク
監視テンプレートの定義例について説明します。
(a) 監視テンプレート
・ネットワークに関連する監視テンプレートのアラーム
ネットワークに関連する監視テンプレートのアラームは,PFM UNIX Template Alarms [NET] 09.00アラームテーブルに格納されています。
表1-17 ネットワークの監視テンプレートのアラーム
監視テンプレートのアラーム 使用レコード 使用フィールド 異常条件 警告条件 値の見方 Network Rcvd/sec PI_NINS Pkts Rcvd/sec >= 9 >= 8 パケット数が多い場合,多量のパケット受信に成功したことを示す。 既存アラームの設定内容については「5. 監視テンプレート」を参照してください。
・ネットワークに関連する監視テンプレートのレポート
表1-18 ネットワークの監視テンプレートのレポート
レポート名 表示する情報 Network Interface Detail 選択したシステムのネットワーク使用状況についてのリアルタイム情報。 Network Interface Summary(ネットワーク使用状況を示すリアルタイムレポート) ネットワーク使用状況についてのリアルタイム情報。 Network Interface Summary(ネットワーク使用状況を示す履歴レポート) 最近1時間のネットワーク使用状況についての履歴情報(分単位)。 Network Overview 最近1時間のネットワーク使用状況についての履歴情報(分単位)。 Network Status (Multi-Agent) 最近24時間の複数ホストのネットワーク使用状況についての履歴情報(時単位)。 Network Status ネットワーク使用状況についてのリアルタイム情報。 既存レポートの設定内容については「5. 監視テンプレート」を参照してください。
(5) プロセス
監視テンプレートの定義例について説明します。
(a) 監視テンプレート
・プロセスに関連する監視テンプレートのアラーム
プロセスに関連する監視テンプレートのアラームは,PFM UNIX Template Alarms [PS] 09.10アラームテーブルに格納されています。
表1-19 プロセスの監視テンプレートのアラーム
監視テンプレートのアラーム 使用レコード 使用フィールド 異常条件 警告条件 値の見方 Process End PD_PDI Program = jpcsto = jpcsto パフォーマンスデータが収集されない場合,プロセスが停止していることを示す。 Process Alive PI_WGRP Process Count > 0 > 0 ワークグループのプロセスが動作していることを示す。 Workgroup = workgroup = workgroup Application Status PD_APP2 Application Name = * = * Application Existフィールドの値がABNORMALの場合,アプリケーションに設定している監視対象のすべてがABNORMALの状態であることを示す。Application Statusフィールドの値がABNORMALの場合,アプリケーションに設定している監視対象のうちどれかがABNORMALの状態であることを示す。 Application Exist = ABNORMAL = NORMAL Application Status = ABNORMAL = ABNORMAL Process Existence PD_APS Program Name = jpcsto = jpcsto レコード収集されない場合,プロセスが停止していることを示す。 既存アラームの設定内容については「5. 監視テンプレート」を参照してください。
・プロセスに関連する監視テンプレートのレポート
表1-20 プロセスの監視テンプレートのレポート
レポート名 表示する情報 CPU Usage - Top 10 Processes CPU使用率上位10個のプロセスについてのリアルタイム情報。 I/O Activity - Top 10 Processes I/O処理数上位10個のプロセスについてのリアルタイム情報。HP-UX,AIX,Linuxの場合は,使用できない。 Major Page Faults - Top 10 Processes 物理的なI/Oを引き起こすページフォルト数上位10個のプロセスについてのリアルタイム情報。 Process Detail 選択したホストのプロセスについてのリアルタイム情報。 Process Overview 最近1時間のプロセスの稼働状況についての履歴情報(分単位)。 Process Summary Status プロセスの稼働状況についてのリアルタイム情報。 既存レポートの設定内容については「5. 監視テンプレート」を参照してください。
All Rights Reserved. Copyright (C) 2009, 2012, Hitachi, Ltd.