2.3.23 AIX環境でsarコマンドの出力結果からプロセッサのパフォーマンスを監視する運用
AIX環境でSimultaneous multithreading(SMT)またはMicro-Partitioningを使用している場合,sarコマンドで表示されるCPU使用率の計算には物理CPUの割り当て量が含まれますが,PFM - Agent for Platformで表示されるCPU使用率の計算には物理CPUの割り当て量が含まれません。そのため,PFM - Agent for Platformで表示されるCPU使用率が,sarコマンドの出力結果より低く表示されることがあります。
PFM - Agent for Platformでは,AIXのsarコマンドの出力結果からプロセッサのパフォーマンスデータを収集するように設定を変更できます。
ここでは,PFM - Agent for Platformで,AIXのsarコマンドの出力結果からプロセッサのパフォーマンスデータを収集し,監視する運用について説明します。
- 〈この項の構成〉
(1) 設定方法
AIXのsarコマンドの出力結果からプロセッサのパフォーマンスデータを収集するための設定方法を次に示します。
-
監視コンソールのWebブラウザからPFM - Web Consoleにログインする。
[メイン]画面が表示されます。
-
[メイン]画面のナビゲーションフレームで[サービス階層]タブを選択する。
[サービス階層]画面が表示されます。
-
ナビゲーションフレームから[Machines]フォルダの下位の階層を展開する。
Performance Managementのサービスがインストールされているホストの名前が付いたフォルダが表示されます。また,ホスト名が付いたフォルダを展開すると,そのホストにインストールされているサービスが表示されます。
各サービスの名前は,サービスIDで表示されます。サービスIDの詳細については「付録C 識別子一覧」,およびマニュアル「JP1/Performance Management 設計・構築ガイド」の付録の,サービスの命名規則について説明している個所を参照してください。
サービスIDの形式は,プロダクト名表示機能が有効か無効かによって異なります。プロダクト名表示機能の詳細については,マニュアル「JP1/Performance Management 設計・構築ガイド」の,Performance Managementの機能について説明している章を参照してください。
-
監視エージェントホストのフォルダの下位にある階層を展開し,ホスト名<UNIX>(Agent Collectorサービス)を選択する。
選択したAgent Collectorサービスにチェックマークが表示されます。
-
メソッドフレームの[プロパティ]メソッドを選択する。
[サービスのプロパティ]画面が表示されます。
-
[Agent Configuration]を選択する。
-
インフォメーションフレームの下部の[sar Command Monitoring]で,sarコマンドの出力結果からプロセッサのパフォーマンスデータを収集するかどうかを指定する。
次のどちらかを指定します。
-
Yes:sarコマンドの出力結果から収集する
-
No:sarコマンドの出力結果から収集しない(デフォルト)
-
-
インフォメーションフレームの下部の[sar Command Interval]で,sarコマンドの引数に指定するインターバル(秒単位)を指定する。
次のAIXのsarコマンドの引数INTERVALに当たる数値を指定します。
/usr/sbin/sar -P ALL INTERVAL 1
1〜50の範囲で指定してください(デフォルトは5)。
(2) sarコマンドの出力結果とPFM - Agent for Platformのレコードとの対応
PFM - Agent for Platformでは,AIX環境でSimultaneous multithreading(SMT)またはMicro-Partitioningを使用している場合に,下記のとおり実行したAIXのsarコマンドの出力結果を収集できます。
/usr/sbin/sar -P ALL INTERVAL 1
AIXのsarコマンドの出力結果の例を次に示します。
PFM - Agent for Platformでは,sarコマンドの出力結果を,System Summary Overview(PI)レコードおよびCPU - Per Processor Detail(PI_CPUP)レコードのプロセッサのパフォーマンスデータを監視するフィールドに格納します。
System Summary Overview(PI)レコードのフィールドとsarコマンドの出力結果の対応を,次の表に示します。
レコード |
フィールド |
フィールドの説明 |
対応するsarコマンドの出力結果 |
---|---|---|---|
System Summary Overview(PI) |
Active CPUs(NUMBER_OF_ACTIVE_CPUS) |
プロセッサ数。 |
cpu列が番号で表示される行数 |
CPU %(KERNELMODE_USERMODE_PERCENT) |
CPU使用率(%)。 プロセッサごとの割合の平均値でもある。 |
%sys列+%usr列 |
|
Idle %(IDLE_TIME_PERCENT) |
アイドル状態だった時間の割合(%)。 プロセッサごとの割合の平均値でもある。 |
%idle列 |
|
Kernel CPU %(KERNELMODE_PERCENT) |
カーネルモードで動作した時間の割合(%)。 プロセッサごとの割合の平均値でもある。 |
%sys列 |
|
User CPU %(USERMODE_PERCENT) |
ユーザーモードで動作した時間の割合(%)。 プロセッサごとの割合の平均値でもある。 |
%usr列 |
|
Wait %(WAIT_TIME_PERCENT) |
I/O待ちの状態だった時間の割合(%)。 プロセッサごとの割合の平均値でもある。 |
%wio列 |
CPU - Per Processor Detail(PI_CPUP)レコードのフィールドとsarコマンドの出力結果の対応を,次の表に示します。
レコード |
フィールド |
フィールドの説明 |
対応するsarコマンドの出力結果 |
---|---|---|---|
CPU - Per Processor Detail(PI_CPUP) |
CPU %(KERNELMODE_USERMODE_PERCENT) |
プロセッサごとのCPU使用率(%)。 |
%sys列+%usr列 |
Idle %(PROCESSOR_IDLE_PERCENT) |
アイドル状態だった時間の割合(%)。 |
%idle |
|
Processor ID(LOGICAL_PROCESSOR_ID) |
プロセッサの識別子。 |
cpu列 |
|
System %(PROCESSOR_SYSTEM_PERCENT) |
カーネルモードで動作した時間の割合(%)。 |
%sys列 |
|
User %(PROCESSOR_USER_PERCENT) |
ユーザーモードで動作した時間の割合(%)。 |
%usr列 |
|
Wait %(PROCESSOR_WAIT_PERCENT) |
I/O待ちの状態だった時間の割合(%)。 |
%wio列 |
AIXのsarコマンドの出力結果からプロセッサのパフォーマンスデータを収集するように設定した場合,System Summary Overview(PI)レコードの次のフィールドは,値が0となります。
レコード |
フィールド |
フィールドの説明 |
使用するアラーム |
使用するレポート |
---|---|---|---|---|
System Summary Overview(PI) |
Total Idle Time(TOTAL_IDLE_TIME) |
すべてのプロセッサでのアイドル状態だった時間の合計値(秒単位)。 |
なし |
なし |
Total Kernel-Mode Time(TOTAL_KERNELMODE_TIME) |
すべてのプロセッサでのカーネルモードで動作した時間の合計値(秒単位)。 |
なし |
なし |
|
Total User-Mode Time(TOTAL_USERMODE_TIME) |
すべてのプロセッサでのユーザーモードで動作した時間の合計値(秒単位)。 |
なし |
なし |
|
Total Wait Time(TOTAL_WAIT_TIME) |
すべてのプロセッサでのI/O待ちの状態だった時間の合計値(秒単位)。 |
なし |
なし |
AIXのsarコマンドの出力結果からプロセッサのパフォーマンスデータを収集するように設定した場合,CPU - Per Processor Detail(PI_CPUP)レコードの次のフィールドは,値が空白となります。
レコード |
フィールド |
フィールドの説明 |
使用するアラーム |
使用するレポート |
---|---|---|---|---|
CPU - Per Processor Detail(PI_CPUP) |
Context Switches(PROCESSOR_CONTEXT_SWITCHES) |
コンテキストスイッチが実行された回数。 |
なし |
なし |
Context Switches/sec(PROCESSOR_CONTEXT_SWITCHES_PER_SECOND) |
コンテキストスイッチが実行された頻度(1秒当たりの回数)。 |
なし |
なし |
|
Idle Time(PROCESSOR_IDLE_TIME) |
アイドル状態だった時間(秒単位)。 |
なし |
なし |
|
Sys Calls/sec(PROCESSOR_SYSTEM_CALLS_PER_SECOND) |
システムコールが発行された頻度(1秒当たりの回数)。 |
なし |
なし |
|
System Calls(PROCESSOR_SYSTEM_CALLS) |
システムコールが発行された回数。 |
なし |
なし |
|
System Time(PROCESSOR_SYSTEM_TIME) |
カーネルモードで動作した時間(秒単位)。 |
なし |
なし |
|
Type(PROCESSOR_TYPE) |
プロセッサの説明。 |
なし |
なし |
|
User Time(PROCESSOR_USER_TIME) |
ユーザーモードで動作した時間(秒単位)。 |
なし |
なし |
|
Wait Time(PROCESSOR_WAIT_TIME) |
I/O待ちの状態だった時間(秒単位)。 |
なし |
なし |
(3) グローバル環境およびWPAR環境でサポートするレコード
sarコマンドの出力結果からプロセッサのパフォーマンスデータを収集する場合,PFM - Agent for Platformがグローバル環境またはSystem WPAR環境のどちらで動作しているかによって,サポートするレコード,および各レコードで収集するデータの範囲が異なります。
グローバル環境またはSystem WPAR環境でサポートするSystem Summary Overview(PI)レコードのフィールドを次の表に示します。
レコード |
フィールド |
グローバル環境 |
System WPAR環境 |
||
---|---|---|---|---|---|
収集 |
収集範囲 |
収集 |
収集範囲 |
||
System Summary Overview(PI) |
15-Minute Run Queue Avg(FIFTEEN_MINUTE_RUN_QUEUE_AVG) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
1-Minute Run Queue Avg(ONE_MINUTE_RUN_QUEUE_AVG) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
5-Minute Run Queue Avg(FIVE_MINUTE_RUN_QUEUE_AVG) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Active CPUs(NUMBER_OF_ACTIVE_CPUS) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Block Ops(BLOCKIO_IO_OPS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Block Reads(BLOCKIO_READ_OPS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Block Reads/sec(BLOCKIO_READ_OPS_PER_SECOND) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Block Writes(BLOCKIO_WRITE_OPS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Block Writes/sec(BLOCKIO_WRITE_OPS_PER_SECOND) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Cache Read %(CACHE_READ_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Cache Write %(CACHE_WRITE_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Context Switches(CONTEXT_SWITCHES) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Context Switches/sec(CONTEXT_SWITCHES_PER_SECOND) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
CPU %(KERNELMODE_USERMODE_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Idle %(IDLE_TIME_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Kernel CPU %(KERNELMODE_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Logical I/O Ops(LOGICAL_IO_OPS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Logical Read Mbytes(LOGICAL_READ_MBYTES) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Logical Reads(LOGICAL_READ_OPS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Logical Reads/sec(LOGICAL_READ_MBYTES_PER_SECOND) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Logical Write Mbytes(LOGICAL_WRITE_MBYTES) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Logical Writes(LOGICAL_WRITE_OPS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Logical Writes/sec(LOGICAL_WRITE_MBYTES_PER_SECOND) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Physical I/O Ops(PHYSICAL_IO_OPS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Physical Reads(PHYSICAL_READ_OPS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
Physical Writes(PHYSICAL_WRITE_OPS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
System Calls(SYSTEM_CALLS) |
○ |
グローバル環境およびすべてのWPAR環境 |
○ |
グローバル環境およびすべてのWPAR環境 |
|
User CPU %(USERMODE_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Wait %(WAIT_TIME_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
グローバル環境またはSystem WPAR環境でサポートするCPU - Per Processor Detail(PI_CPUP)レコードのフィールドを次の表に示します。
レコード |
フィールド |
グローバル環境 |
System WPAR環境 |
||
---|---|---|---|---|---|
収集 |
収集範囲 |
収集 |
収集範囲 |
||
CPU - Per Processor Detail(PI_CPUP) |
Boot Time(SYSTEM_BOOT_TIME) |
○ |
グローバル環境 |
× |
× |
CPU %(KERNELMODE_USERMODE_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Idle %(PROCESSOR_IDLE_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Interval(INTERVAL) |
○ |
グローバル環境 |
× |
× |
|
Processor ID(LOGICAL_PROCESSOR_ID) |
○ |
グローバル環境 |
× |
× |
|
Record Time(RECORD_TIME) |
○ |
グローバル環境 |
× |
× |
|
Record Type(INPUT_RECORD_TYPE) |
○ |
固定値 |
× |
× |
|
Status(PROCESSOR_STATUS) |
○ |
グローバル環境 |
× |
× |
|
System %(PROCESSOR_SYSTEM_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Up Time(SYSTEM_UP_TIME) |
○ |
グローバル環境 |
× |
× |
|
User %(PROCESSOR_USER_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
|
Wait %(PROCESSOR_WAIT_PERCENT) |
○ |
グローバル環境およびすべてのWPAR環境 |
× |
× |
(4) 注意事項
ここでは,PFM - Agent for Platformで,AIXのsarコマンドの出力結果からプロセッサのパフォーマンスデータを収集し,監視する運用での注意事項について説明します。
-
プロセッサのパフォーマンスデータをsarコマンドの出力結果から収集する場合,sarコマンドの出力結果から収集しない場合に比べて,PFM - Web Consoleの[サービスのプロパティ]画面で設定したインターバルの分だけ,レコードの収集に時間が掛かります。PFM - Web Consoleの[サービスのプロパティ]画面で,レコードの収集時間以上の数値をインターバルに指定すると,レコードの収集がスキップされます。
-
sarコマンド実行の失敗などの原因でパフォーマンスデータを収集できなかった場合,System Summary Overview(PI)レコードでは該当するフィールドの値が0となり,CPU - Per Processor Detail(PI_CPUP)レコードではパフォーマンスデータが収集されません。
-
プロセッサのパフォーマンスデータをsarコマンドの出力結果から収集する場合とsarコマンドの出力結果から収集しない場合では,System Summary Overview(PI)レコードおよびCPU - Per Processor Detail(PI_CPUP)レコードの各フィールドに格納される数値が異なります。プロセッサのパフォーマンスデータをsarコマンドの出力結果から収集する場合とsarコマンドの出力結果から収集しない場合の各フィールドに格納される数値の違いを次の表に示します。
-
sarコマンドの出力結果からプロセッサのパフォーマンスを監視する場合,次の(1)と(2),または(1)と(3)の機能を同時に使用しないでください。同時に使用すると履歴データの収集やアラーム監視がスキップされることがあります。
(1)PIレコードまたはPI_CPUPレコードのリアルタイムレポートの表示。
(2)PIレコードまたはPI_CPUPレコードの履歴データ収集。
(3)PIレコードまたはPI_CPUPレコードのアラーム監視。
表2‒51 プロセッサのパフォーマンスデータをsarコマンドの出力結果から収集する場合とsarコマンドの出力結果から収集しない場合で各フィールドに格納される数値の違い(リアルタイムレポートで[デルタ値を表示]をチェックしているとき) レコード
フィールド
データソース
sarコマンドの出力結果を収集しない場合
sarコマンドの出力結果を収集する場合
System Summary Overview(PI)
Active CPUs(NUMBER_OF_ACTIVE_CPUS)
収集時点の値を基に計算した結果
収集時点の値
CPU %(KERNELMODE_USERMODE_PERCENT)
変化量を基に計算した結果
収集時点の値
Idle %(IDLE_TIME_PERCENT)
変化量を基に計算した結果
収集時点の値
Kernel CPU %(KERNELMODE_PERCENT)
変化量を基に計算した結果
収集時点の値
User CPU %(USERMODE_PERCENT)
変化量を基に計算した結果
収集時点の値
Wait %(WAIT_TIME_PERCENT)
変化量を基に計算した結果
収集時点の値
CPU - Per Processor Detail(PI_CPUP)
CPU %(KERNELMODE_USERMODE_PERCENT)
変化量を基に計算した結果
収集時点の値
Idle %(PROCESSOR_IDLE_PERCENT)
変化量を基に計算した結果
収集時点の値
Processor ID(LOGICAL_PROCESSOR_ID)
収集時点の値
収集時点の値
System %(PROCESSOR_SYSTEM_PERCENT)
変化量を基に計算した結果
収集時点の値
User %(PROCESSOR_USER_PERCENT)
変化量を基に計算した結果
収集時点の値
Wait %(PROCESSOR_WAIT_PERCENT)
変化量を基に計算した結果
収集時点の値
表2‒52 プロセッサのパフォーマンスデータをsarコマンドの出力結果から収集する場合とsarコマンドの出力結果から収集しない場合で各フィールドに格納される数値の違い(リアルタイムレポートで[デルタ値を表示]をチェックしていないとき) レコード
フィールド
データソース
sarコマンドの出力結果を収集しない場合
sarコマンドの出力結果を収集する場合
System Summary Overview(PI)
Active CPUs(NUMBER_OF_ACTIVE_CPUS)
収集時点の値を基に計算した結果
収集時点の値
CPU %(KERNELMODE_USERMODE_PERCENT)
累積値を基に計算した結果
収集時点の値
Idle %(IDLE_TIME_PERCENT)
累積値を基に計算した結果
収集時点の値
Kernel CPU %(KERNELMODE_PERCENT)
累積値を基に計算した結果
収集時点の値
User CPU %(USERMODE_PERCENT)
累積値を基に計算した結果
収集時点の値
Wait %(WAIT_TIME_PERCENT)
累積値を基に計算した結果
収集時点の値
CPU - Per Processor Detail(PI_CPUP)
CPU %(KERNELMODE_USERMODE_PERCENT)
累積値を基に計算した結果
収集時点の値
Idle %(PROCESSOR_IDLE_PERCENT)
累積値を基に計算した結果
収集時点の値
Processor ID(LOGICAL_PROCESSOR_ID)
収集時点の値
収集時点の値
System %(PROCESSOR_SYSTEM_PERCENT)
累積値を基に計算した結果
収集時点の値
User %(PROCESSOR_USER_PERCENT)
累積値を基に計算した結果
収集時点の値
Wait %(PROCESSOR_WAIT_PERCENT)
累積値を基に計算した結果
収集時点の値
-
CPU - Per Processor Detail(PI_CPUP)レコードのStatusフィールドが「On Line」のインスタンスのパフォーマンスデータだけが収集されます。
-
プロセッサのパフォーマンスデータをsarコマンドの出力結果から収集しない設定を,sarコマンドの出力結果から収集する設定に変更した場合,変更前に収集したパフォーマンスデータと変更後に収集したパフォーマンスデータに,連続性はありません。そのため,変更前と変更後のパフォーマンスデータを,別のパフォーマンスデータとして扱う必要があります。必要に応じて,システムリソースを変更する前に,Storeデータベースをバックアップして,その後,Storeデータベースをクリアしてから新しいパフォーマンスデータの収集を開始するなどの対処をしてください。Storeデータベースのバックアップ方法については,マニュアル「JP1/Performance Management 運用ガイド」の,バックアップとリストアについて説明している章を参照してください。
-
PFM - Agent for PlatformがAIXのSystem WPAR環境で動作している場合,sarコマンドを実行するとエラーとなるため,System Summary Overview(PI)レコードでは該当するフィールドの値が0となり,CPU - Per Processor Detail(PI_CPUP)レコードの各フィールドではパフォーマンスデータが収集されません。
-
sarコマンドの出力結果からプロセッサのパフォーマンスを監視する場合,次の1と2,または,1と3の機能を同時に使用しないでください。同時に使用すると履歴データの収集やアラーム監視がスキップされることがあります。
-
PIレコードまたはPI_CPUPレコードのリアルタイムレポートの表示
-
PIレコードまたはPI_CPUPレコードの履歴データ収集
-
PIレコードまたはPI_CPUPレコードのアラーム監視
-
-
Agent Collectorサービスがsarコマンドからパフォーマンスデータを収集している間,[サービスのプロパティ]画面からAgent Collectorサービスに接続できません。[sar Command Interval]に指定した時間が経過したあと,Agent Collectorサービスに接続してください。
-
sarコマンドの出力結果からパフォーマンスを監視する場合,次のパッケージ,または後継パッケージが適用されていることを確認してください。
OS
パッケージ
APAR
AIX6.1
6100
IZ23569
6100 TL1
IZ21742
6100 TL2
IZ20964
-
PFM - Web Consoleの[サービスのプロパティ]画面で[sar CommandMonitoring]を変更した場合,初回収集時のパフォーマンスデータが極端に大きい値,またはマイナス値になることがあります。そのため,PI_CPUPおよびPIレコードのパフォーマンスを監視するアラームをバインドしている場合,アンバインドを実行したあとにプロパティを更新してください。なお,2回目以降のパフォーマンスデータは正常な値が収集されます。
-
Agent Collectorサービス起動時にPFM - Web Consoleの[サービスのプロパティ]画面の[sar Command Monitoring]の値が"Yes"の場合,"No"に変更した次のPI_CPUPレコードのパフォーマンスデータは収集されません。