7.6 高負荷による障害発生を防止するための運用
高負荷によるサーバや系のスローダウンを防止するために,ユーザは次の情報を基に,定義ファイルの設定やシステム構成が適切かどうかを調査します。
-
OSの情報
-
HAモニタとのインタフェースを持つプログラムの情報
-
監視履歴で取得したスローダウンの情報
監視履歴とは,サーバや系に発生したスローダウンの履歴のことです。
監視履歴を取得する対象となるのは,自系で稼働しているサーバモードのサーバ,および自系・他系です。これらの監視履歴は,監視履歴ファイルに出力されます。監視履歴ファイルには,サーバ障害監視時間や系障害監視時間を超えたスローダウンだけでなく,サーバ障害監視時間や系障害監視時間に達しないスローダウン,つまりHAモニタが障害として検出しないスローダウンも記録されます。障害として検出されなかったスローダウンの履歴を解析することで,次のことができます。
-
定義ファイルに設定したサーバ障害監視時間,および系障害監視時間の見直し
-
システムの負荷状況の把握による,システム構成の見直し
また,事前にシェルを作成しておくことで,サーバのスローダウンが発生した場合に原因を調査することもできます。
ここでは,監視履歴を取得,解析する方法,およびサーバのスローダウンの原因を調査する方法について説明します。
- 重要
-
次の場合は,サーバの監視履歴を取得できません。
-
待機サーバの場合
また,次の場合は,サーバの監視履歴の取得,およびサーバのスローダウンの検出ができません。
-
サーバモードのサーバとしてTP1/EEを使用する場合
-
サーバをモニタモードで使用する場合
-