Hitachi

JP1 Version 12 JP1/Performance Management - Remote Monitor for Virtual Machine


1.9.3 CPUリソースの監視

ここでは,VirtageシステムのCPUリソースを監視する方法について説明します。

〈この項の構成〉

(1) 概要

Virtageシステムでは,ホストマシン上のCPUをそれぞれのLPARに割り当てて使用します。各LPARに割り当てられるCPUリソースのことを仮想CPUと呼びます。LPAR上で稼働するOSは,仮想CPUを通常の物理CPUとして認識します。

Virtageでは,次の2種類の方式で物理CPUをLPARに割り当てます。

また,Virtageシステムを管理するハイパーバイザーは,すべての物理CPUのリソースを使用します。ハイパーバイザーは,カーネル部(これをSYS1と呼びます)と通信・サービス部(これをSYS2と呼びます)に分類できます。

LPARおよびハイパーバイザーと仮想CPUの関係を次の図に示します。

図1‒92 LPAR,ハイパーバイザーおよび仮想CPUの関係

[図データ]

共有モードで稼働するLPARが複数存在する場合,次のような問題が生じることがあります。

この場合,共有モードで割り当てたCPUリソースを有効利用するには,Virtageのキャッピング機能やアイドル検出機能に関する設定を見直す必要があります。

また,占有モードと共有モードを混在させて運用した場合,次のような問題が生じることがあります。

この場合,LPARの負荷を分散させるには,占有モードのLPARを共有モードに切り替える必要があります。

CPUのパフォーマンスデータを監視することで,こうしたLPARの性能低下を把握できるため,対策を講じることができます。CPUリソースを監視するレコードには,次の4つがあります。レコードの詳細については,「5. レコード」を参照してください。

  1. PIレコード

    ホストマシンのCPUのパフォーマンスデータを監視できます。

  2. PI_HCIレコード

    物理CPUの各コアのパフォーマンスデータを監視できます。

  3. PI_VIレコード

    各LPARが利用しているCPUのパフォーマンスデータを監視できます。

  4. PI_VCIレコード

    各仮想CPUのパフォーマンスデータを監視できます。

次の図に,それぞれのレコードのパフォーマンスデータ収集範囲を示します。

図1‒93 レコードとデータ収集範囲の対応

[図データ]

なお,Virtageシステムでは,仮想NICのサービスを提供するときに,SYS2に割り当てられたCPUリソースを使用します。このため,CPUリソースのパフォーマンスは仮想NICの利用状況に影響されます。CPUリソースと仮想NICに関するリソースを同時に監視することで,より効果的にVirtageシステムのパフォーマンスを把握できます。

ヒント

Virtageシステムでは,LPARのディスクアクセスにHBAを使用します。HBAの処理はSYS1のCPUリソースを消費します。ただし,仮想NICサービスによるCPU消費ほどの影響はありません。

(2) 監視例

ここでは,LPARのvhost1〜2のCPUリソース監視を例に,CPUリソースが不足する要因と問題への対処方法を説明します。次の図に,ここで取り上げる監視項目と対処の流れを示します。

図1‒94 監視項目と対処の流れ

[図データ]

(a) LPARのCPU不足率を監視する例

LPARのCPU不足率は,PI_VIレコードのInsufficient %フィールドで確認できます。LPARに対して十分なCPUリソースが割り当てられている場合,CPU不足率は0%に近づきます。なお,この監視項目は,監視テンプレートに用意されているアラームで監視できます。

監視例を次の図に示します。

図1‒95 CPU不足率の監視例

[図データ]

確認する監視テンプレートレポート

VM CPU Insufficient

確認する監視テンプレートアラーム

VM CPU Insufficient

この例では,vhost2のCPUリソースがかなり不足していると考えられます。この場合,SYS2のCPU使用状況を確認してください。

(b) ホストマシンのCPU使用量を監視する例

ホストマシンのCPU使用量は,PIレコードのVM Usedフィールド,VMM Kernel UsedフィールドおよびVMM Others Usedフィールドで確認できます。VM Usedフィールドは各LPARのCPU使用量を示します。VMM Kernel Usedフィールドは,SYS1のCPU使用量を示します。VMM Others Usedフィールドは,SYS2のCPU使用量を示します。

監視例を次の図に示します。

図1‒96 CPU使用量の監視例

[図データ]

確認する監視テンプレートレポート

Host CPU Used Status

SYS2のCPU使用量がしきい値を超えている場合は,仮想NICに高い負荷が掛かっているおそれがあります。確認および対処方法については,「1.9.6 ネットワークリソースの監視」を参照してください。

ヒント

SYS2のCPU使用量について,しきい値の目安はCPU2コア分の使用量です。例えば,システムに搭載されているCPUが8コアの場合,全体の25%に相当する使用量がしきい値になります。

また,SYS1とSYS2の合計CPU使用量がしきい値を超えている場合,ディスクアクセス時にHBAに高い負荷が掛かっているおそれがあります。確認および対処方法については,「1.9.5 ディスクリソースの監視」を参照してください。

ヒント

SYS1とSYS2の合計CPU使用量の目安となるしきい値は,全体の90%です。

(c) LPARのCPU割り当て上限値・均衡値を確認する例

LPARのCPU割り当て上限値は,PI_VIレコードのMaxフィールドで確認できます。また,LPARのCPU割り当て均衡値は,PI_VIレコードのExpectationフィールドで確認できます。CPU割り当て上限値・均衡値を比較することで,LPARのCPUリソース不足の要因を調査できます。

監視例を次の図に示します。

図1‒97 CPU割り当て上限値・均衡値の監視例

[図データ]

確認する複合レポート(1.10参照)

仮想マシン−CPU割り当て上限設定値の監視

LPARのCPUリソースが不足している場合,MaxフィールドとExpectationフィールドの値を比較してください。比較結果によって,次に示すようにCPUリソース不足に対処できる場合があります。

  • Maxフィールドの値がExpectationフィールドの値より大きい場合

    LPARのCPUサービス率が低く設定されています。サービス率の設定を見直してください。

  • MaxフィールドとExpectationフィールドの値が同等な場合

    LPARに割り当てられるCPUリソースが,キャッピング機能によって制限されています。キャッピング機能の設定を見直してください。

(3) CPUサービス率・キャッピング機能・CPUアイドル検出機能の設定について

Virtageシステムでは,CPUのLPAR割り当てに関して次に示す機能があります。これらの機能の設定によっては,LPARに適切にCPUリソースを配分できないことがあるため注意してください。

CPUサービス率・キャッピング機能

CPUサービス率の設定によって,LPARに対するCPU割り当てを割合で指定できます。また,キャッピング機能を有効にした場合,LPARへのCPU割り当てが不足しても,CPUサービス率が割り当て量の上限となります。

CPUリソースを多く消費するLPARに対して,サービス率が小さく設定されていて,キャッピング機能が有効な場合,そのLPARには十分なCPUリソースが割り当てられないことがあります。

CPUアイドル検出機能

LPARのCPUがアイドル状態にあるかどうかを検出する機能です。Virtageシステムでは,あるLPARのCPUがアイドル状態にある場合,そのリソースをCPUリソースが不足したLPARに割り当てます。CPUアイドル検出機能が無効の場合,CPUがアイドル状態でもほかのLPARに割り当てられないため,CPUリソースを有効活用できない場合があります。