7.1 障害管理の概要

JP1/ServerConductorでは,管理対象のホスト,サーバシャーシ,または管理サーバで発生した障害(アラート)を検出し,システム管理者へさまざまな方法で通知できます。

JP1/ServerConductorでできる障害管理について,次に説明します。

なお,仮想化プラットフォームのサーバの障害管理については「24.3.3 障害管理」を参照してください。

<この節の構成>
(1) アラート情報を表示する
(2) 必要なアラートだけを通知する
(3) 未通知アラートを通知する
(4) アラート発生時の管理対象サーバの動作を設定する
(5) アラート受信時にプログラムを自動起動する
(6) アラートをほかのプログラムに通知する
(7) アラートをe-mailで通知する
(8) アラートをログファイルに記録する
(9) ウォッチドッグタイマによる障害監視をする

(1) アラート情報を表示する

管理対象のホスト,サーバシャーシ,または管理サーバで発生したアラートを,管理コンソールに表示できます。また,管理対象のホストに記録されたサーバアラートログ,BIOSポストログ,SVPログの各種ログ情報を表示できます。

(2) 必要なアラートだけを通知する

管理対象ホストで発生したアラートのうち,特定のアラートレベルや特定のアラートだけを通知できます。

(3) 未通知アラートを通知する

管理コンソールが接続していない間に発生したアラートを,管理コンソールが管理サーバに接続した時に通知できます。この機能は,BSMの場合だけ使用できます(Server Managerでは使用できません)。

また,管理サーバが接続していない間にアラートが発生した場合,管理サーバが管理対象サーバに接続した時に,未通知のアラートがある旨を通知できます。

(4) アラート発生時の管理対象サーバの動作を設定する

各アラートに対して,アラートが発生したら管理サーバに通知するか,何回同一アラートが発生したら管理サーバに通知するか,など,アラートの通知契機を設定できます。また,アラートの発生を契機に,管理対象サーバの電源OFFやリブートなどを自動的に実行できます。

(5) アラート受信時にプログラムを自動起動する

アラートの受信を契機に,あらかじめ設定しておいたプログラムを自動で起動できます。また,起動するプログラムのパラメタとして,アラートIDや発生時刻など,アラートの情報を設定しておくこともできます。

(6) アラートをほかのプログラムに通知する

JP1/IMにアラートを通知できます。また,アラートをSNMP Trapに変換して,SNMPマネージャに通知することもできます。

(7) アラートをe-mailで通知する

管理対象のホスト,サーバシャーシ,または管理サーバで発生したアラートをe-mailでシステム管理者に通知できます。

(8) アラートをログファイルに記録する

管理対象のホストで発生したアラートを,ログファイルに記録できます。

また,管理対象ホストがWindowsの場合,アラートをシステムのイベントログに記録できます。管理対象サーバがLinuxまたはHP-UXサーバの場合,syslogファイルに記録できます。

(9) ウォッチドッグタイマによる障害監視をする

Agentから一定の間隔で送信されるResetコマンドをBMCが受信することで,OSが正しく動作しているかどうかを監視できます。また,OSに異常が発生した場合に管理対象サーバの電源をどのように制御するかを設定できます。