JP1/ServerConductor/Blade Server Manager系 運用ガイド

[目次][用語][索引][前へ][次へ]

2.1 障害管理の概要

JP1/ServerConductorでは,管理対象ホスト,サーバシャーシ,IOEU,または管理サーバで発生した障害(アラート)を検出し,システム管理者へさまざまな方法で通知できます。

JP1/ServerConductorでできる障害管理について,次の表に示します。

なお,LPAR上で稼働しているサーバの障害管理については,物理サーバの場合と同じです。仮想化プラットフォームのサーバの障害管理については,「14.3.3 障害管理」を参照してください。

表2-1 JP1/ServerConductorでできる障害管理

項番 障害管理の種類 管理対象
ホスト サーバシャーシ IOEU 管理サーバ
1 アラート情報の表示
2 必要なアラートだけの通知 × × ×
3 未通知アラートの通知 ×
4 アラート発生時の管理対象サーバの動作の設定 × × ×
5 アラート受信時のプログラムの自動起動
6 アラートのJP1/IMへの通知
7 アラートのJP1/Cm2/NNMへの通知 × × ×
8 アラートのe-mailでの通知
9 アラートのログファイルへの記録 × × ×
10 ウォッチドッグタイマによる障害監視 × × ×

(凡例)
○:できる
×:できない

次に,表のそれぞれの項目について説明します。

<この節の構成>
(1) アラート情報を表示する
(2) 必要なアラートだけを通知する
(3) 未通知アラートを通知する
(4) アラート発生時の管理対象サーバの動作を設定する
(5) アラート受信時にプログラムを自動起動する
(6) アラートをほかのプログラムに通知する
(7) アラートをe-mailで通知する
(8) アラートをログファイルに記録する
(9) ウォッチドッグタイマによる障害監視をする

(1) アラート情報を表示する

管理対象ホスト,サーバシャーシ,IOEU,または管理サーバで発生したアラートを,管理コンソールに表示できます。また,管理対象に記録されたサーバアラートログ,BIOSポストログ,SVPログ,装置ログや,管理サーバに記録されたマネージャアラートログなどの各種ログ情報を表示できます。

(2) 必要なアラートだけを通知する

管理対象ホストで発生したアラートのうち,特定のアラートレベルや特定のアラートだけを通知できます。この機能は,管理対象ホストで発生したアラートに対してだけ使用できます。

(3) 未通知アラートを通知する

管理コンソールが接続していない間に発生したアラートを,管理コンソールが管理サーバに接続した時に通知できます。

また,管理サーバが停止していて,管理対象から管理サーバに接続できない間にアラートが発生した場合,管理サーバが起動して再び管理対象からの接続が可能になったタイミングで,未通知のアラートがある旨を通知できます。この機能は,管理対象ホスト,サーバシャーシ,またはIOEUで発生したアラートに対してだけ使用できます。

(4) アラート発生時の管理対象サーバの動作を設定する

各アラートに対して,アラートが発生したら管理サーバに通知するか,何回同一アラートが発生したら管理サーバに通知するか,など,アラートの通知契機を設定できます。また,アラートの発生を契機に,管理対象サーバの電源OFFやリブートなどを自動的に実行できます。この機能は,管理対象ホストで発生したアラートに対してだけ使用できます。

(5) アラート受信時にプログラムを自動起動する

アラートの受信を契機に,あらかじめ設定しておいたプログラムを自動で起動できます。また,起動するプログラムのパラメタとして,アラートIDや発生時刻など,アラートの情報を設定しておくこともできます。この機能は,管理対象ホスト,サーバシャーシ,IOEU,または管理サーバで発生したアラートに対して使用できます。

(6) アラートをほかのプログラムに通知する

管理対象ホスト,サーバシャーシ,IOEU,または管理サーバで発生したアラートをJP1/IMに通知できます。また,管理対象ホストで発生したハードウェア障害を示すアラートをSNMP Trapに変換して,JP1/Cm2/NNMに通知することもできます。

(7) アラートをe-mailで通知する

管理対象ホスト,サーバシャーシ,IOEU,または管理サーバで発生したアラートをe-mailでシステム管理者に通知できます。

(8) アラートをログファイルに記録する

管理対象ホストまたはIOEUで発生したアラートを,ログファイルに記録できます。

また,管理対象ホストがWindowsの場合,アラートをシステムのイベントログに記録できます。管理対象サーバがLinuxまたはHP-UXサーバの場合,syslogファイルに記録できます。

(9) ウォッチドッグタイマによる障害監視をする

Agentから一定の間隔で送信されるResetコマンドをBMCが受信することで,OSが正しく動作しているかどうかを監視できます。また,OSに異常が発生した場合に管理対象サーバの電源をどのように制御するかを設定できます。