1.6.3 CPUリソースの監視
ここでは,VirtageシステムのCPUリソースを監視する方法について説明します。
(1) 概要
Virtageシステムでは,ホストマシン上のCPUをそれぞれのLPARに割り当てて使用します。各LPARに割り当てられるCPUリソースのことを仮想CPUと呼びます。LPAR上で稼働するOSは,仮想CPUを通常の物理CPUとして認識します。
Virtageでは,次の2種類の方式で物理CPUをLPARに割り当てます。
-
指定した数の物理CPUを,単独のLPARに占有させる方式です。LPARごとのCPUリソース利用比率は,CPU割り当て数を変更することで調整できます。
-
指定した数の物理CPUを,複数のLPARで共有させる方式です。LPARごとのCPUリソース利用比率は,CPUサービス率を設定することで調整できます。
また,Virtageシステムを管理するハイパーバイザーは,すべての物理CPUのリソースを使用します。ハイパーバイザーは,カーネル部(これをSYS1と呼びます)と通信・サービス部(これをSYS2と呼びます)に分類できます。
LPARおよびハイパーバイザーと仮想CPUの関係を次の図に示します。
|
共有モードで稼働するLPARが複数存在する場合,次のような問題が生じることがあります。
-
ホストマシン全体では共有モードで割り当てたCPUリソースに空きがあるにもかかわらず,特定のLPARでCPUリソース不足が発生してしまう
この場合,共有モードで割り当てたCPUリソースを有効利用するには,Virtageのキャッピング機能やアイドル検出機能に関する設定を見直す必要があります。
また,占有モードと共有モードを混在させて運用した場合,次のような問題が生じることがあります。
-
共有モードで稼働するLPARのCPUリソースが不足しても,占有モードの物理CPUのリソースを利用できないために,LPARの性能が低下する
この場合,LPARの負荷を分散させるには,占有モードのLPARを共有モードに切り替える必要があります。
CPUのパフォーマンスデータを監視することで,こうしたLPARの性能低下を把握できるため,対策を講じることができます。CPUリソースを監視するレコードには,次の4つがあります。レコードの詳細については,「5. レコード」を参照してください。
-
PIレコード
ホストマシンのCPUのパフォーマンスデータを監視できます。
-
PI_HCIレコード
物理CPUの各コアのパフォーマンスデータを監視できます。
-
PI_VIレコード
各LPARが利用しているCPUのパフォーマンスデータを監視できます。
-
PI_VCIレコード
各仮想CPUのパフォーマンスデータを監視できます。
次の図に,それぞれのレコードのパフォーマンスデータ収集範囲を示します。
|
なお,Virtageシステムでは,仮想NICのサービスを提供するときに,SYS2に割り当てられたCPUリソースを使用します。このため,CPUリソースのパフォーマンスは仮想NICの利用状況に影響されます。CPUリソースと仮想NICに関するリソースを同時に監視することで,より効果的にVirtageシステムのパフォーマンスを把握できます。
- ヒント
-
Virtageシステムでは,LPARのディスクアクセスにHBAを使用します。HBAの処理はSYS1のCPUリソースを消費します。ただし,仮想NICサービスによるCPU消費ほどの影響はありません。
(2) 監視例
ここでは,LPARのvhost1〜2のCPUリソース監視を例に,CPUリソースが不足する要因と問題への対処方法を説明します。次の図に,ここで取り上げる監視項目と対処の流れを示します。
|
(a) LPARのCPU不足率を監視する例
LPARのCPU不足率は,PI_VIレコードのInsufficient %フィールドで確認できます。LPARに対して十分なCPUリソースが割り当てられている場合,CPU不足率は0%に近づきます。なお,この監視項目は,監視テンプレートに用意されているアラームで監視できます。
監視例を次の図に示します。
|
- 確認する監視テンプレートレポート
- 確認する監視テンプレートアラーム
この例では,vhost2のCPUリソースがかなり不足していると考えられます。この場合,SYS2のCPU使用状況を確認してください。
(b) ホストマシンのCPU使用量を監視する例
ホストマシンのCPU使用量は,PIレコードのVM Usedフィールド,VMM Kernel UsedフィールドおよびVMM Others Usedフィールドで確認できます。VM Usedフィールドは各LPARのCPU使用量を示します。VMM Kernel Usedフィールドは,SYS1のCPU使用量を示します。VMM Others Usedフィールドは,SYS2のCPU使用量を示します。
監視例を次の図に示します。
|
- 確認する監視テンプレートレポート
SYS2のCPU使用量がしきい値を超えている場合は,仮想NICに高い負荷が掛かっているおそれがあります。確認および対処方法については,「1.6.6 ネットワークリソースの監視」を参照してください。
- ヒント
-
SYS2のCPU使用量について,しきい値の目安はCPU2コア分の使用量です。例えば,システムに搭載されているCPUが8コアの場合,全体の25%に相当する使用量がしきい値になります。
また,SYS1とSYS2の合計CPU使用量がしきい値を超えている場合,ディスクアクセス時にHBAに高い負荷が掛かっているおそれがあります。確認および対処方法については,「1.6.5 ディスクリソースの監視」を参照してください。
- ヒント
-
SYS1とSYS2の合計CPU使用量の目安となるしきい値は,全体の90%です。
(c) LPARのCPU割り当て上限値・均衡値を確認する例
LPARのCPU割り当て上限値は,PI_VIレコードのMaxフィールドで確認できます。また,LPARのCPU割り当て均衡値は,PI_VIレコードのExpectationフィールドで確認できます。CPU割り当て上限値・均衡値を比較することで,LPARのCPUリソース不足の要因を調査できます。
監視例を次の図に示します。
|
- 確認する複合レポート(1.9参照)
-
仮想マシン−CPU割り当て上限設定値の監視
LPARのCPUリソースが不足している場合,MaxフィールドとExpectationフィールドの値を比較してください。比較結果によって,次に示すようにCPUリソース不足に対処できる場合があります。
-
Maxフィールドの値がExpectationフィールドの値より大きい場合
LPARのCPUサービス率が低く設定されています。サービス率の設定を見直してください。
-
MaxフィールドとExpectationフィールドの値が同等な場合
LPARに割り当てられるCPUリソースが,キャッピング機能によって制限されています。キャッピング機能の設定を見直してください。
(3) CPUサービス率・キャッピング機能・CPUアイドル検出機能の設定について
Virtageシステムでは,CPUのLPAR割り当てに関して次に示す機能があります。これらの機能の設定によっては,LPARに適切にCPUリソースを配分できないことがあるため注意してください。
- CPUサービス率・キャッピング機能
-
CPUサービス率の設定によって,LPARに対するCPU割り当てを割合で指定できます。また,キャッピング機能を有効にした場合,LPARへのCPU割り当てが不足しても,CPUサービス率が割り当て量の上限となります。
CPUリソースを多く消費するLPARに対して,サービス率が小さく設定されていて,キャッピング機能が有効な場合,そのLPARには十分なCPUリソースが割り当てられないことがあります。
- CPUアイドル検出機能
-
LPARのCPUがアイドル状態にあるかどうかを検出する機能です。Virtageシステムでは,あるLPARのCPUがアイドル状態にある場合,そのリソースをCPUリソースが不足したLPARに割り当てます。CPUアイドル検出機能が無効の場合,CPUがアイドル状態でもほかのLPARに割り当てられないため,CPUリソースを有効活用できない場合があります。