7.5 高負荷による障害発生を防止するための運用

高負荷によるサーバや系のスローダウンを防止するために,ユーザは次の情報を基に,定義ファイルの設定やシステム構成が適切かどうかを調査します。

監視履歴とは,サーバや系に発生したスローダウンの履歴のことです。

監視履歴を取得する対象となるのは,自系で稼働しているサーバモードのサーバ,および自系・他系です。これらの監視履歴は,監視履歴ファイルに出力されます。監視履歴ファイルには,サーバ障害監視時間や系障害監視時間を超えたスローダウンだけでなく,サーバ障害監視時間や系障害監視時間に達しないスローダウン,つまりHAモニタが障害として検出しないスローダウンも記録されます。障害として検出されなかったスローダウンの履歴を解析することで,次のことができます。

また,事前にシェルを作成しておくことで,サーバのスローダウンが発生した場合に原因を調査することもできます。

ここでは,監視履歴を取得,解析する方法,およびサーバのスローダウンの原因を調査する方法について説明します。

注意
次の場合は,サーバの監視履歴を取得できません。
  • 待機サーバの場合
また,次の場合は,サーバの監視履歴の取得,およびサーバのスローダウンの検出ができません。
  • サーバモードのサーバとしてTP1/EEまたはHiRDB(XDS)を使用する場合
  • サーバをモニタモードで使用する場合
<この節の構成>
7.5.1 サーバの監視履歴を取得する
7.5.2 系の監視履歴を取得する
7.5.3 取得した監視履歴を解析する
7.5.4 サーバのスローダウンの原因を調査する