Hitachi

JP1 Version 12 JP1/Integrated Management 2 - Manager 導入・設計ガイド


11.3.3 検知・通知の設計

監視方法および監視項目を検討したあと,問題を検知したときの対処について検討します。

図11‒3 問題の重大度と対応の検討

[図データ]

〈この項の構成〉

(1) JP1イベントと重大度の検討

JP1/IMはシステムで発生した事象を,JP1イベントによって管理します。このJP1イベントには,発生した事象の重大さを表す重大度が設定されています。

この重大度を軸にして,問題の検知と通知について,検討を進めます。

JP1イベントの重大度による分類

JP1イベントでの重大度(項目名:E.SEVERITY)を軸にして分類します。

なお,JP1イベントは,システムで発生する事象と重大度の対応を定義しており,各製品は,管理する対象に合わせて適切な重大度を設定しています。

SNMPトラップやWindowsイベントログをJP1イベントに変換している場合は,変換元の重大度がJP1イベントの重大度に対応づけられています。また,統合監視DBを使用する場合に,JP1イベントの重大度をユーザーが定義した重大度に変更しているときは,ユーザーが定義した重大度がJP1イベントの重大度に対応づけられます。元のイベントの重大度を確認して,JP1イベントと同様に分類してください。ログファイル上のメッセージを変換した場合は,変換の設定によって任意の重大度が設定されています。適切な重大度になるよう設定してください。

分類したJP1イベントの確認

重大度ごとに分類したJP1イベントを確認します。

各JP1は一般的な運用に合わせて適切な重大度が設定されていますが,システムの運用によっては重要なイベントとして扱う必要がないものもありえます。このようなイベントがないかを確認します。

(2) 緊急度に応じた対応の検討

分類したJP1イベントについて,緊急度に応じて対応方法を検討します。

ここでは,例として3段階(緊急,重要,通常)に分けた対応方法を説明します。

緊急の対応が必要なイベント

JP1/IMで管理するイベントから,至急の対応が必要なイベントがないかを検討します。例えば,システムダウンは業務に致命的な影響を与えるため,即時対応が必要です。

このような障害が発生した場合は,管理者に通知することを検討します。

なお,管理者への通知は,負担を考えて緊急性の必要なイベントだけにします。また,内容によって,通知する範囲を変えるなども検討してください。

JP1/IMでは,自動アクションによってコマンドを実行し,緊急の連絡をすることができます。通知が必要なイベントを一意に判定する方法と,通知するためのコマンド(例えばメール送信コマンド)を検討して,自動アクションとして定義します。

監視が必要な重要イベント

重大度が,異常の発生を意味する場合は,監視対象のイベントとして対応することを検討します。

まず,監視が必要な重要なイベントについては,JP1/IMマネージャーへ転送し,一元的に管理するようにします。

また,JP1/IMでは,重要イベントとして扱うJP1イベントを重大度などにより定義します。重要イベントとして扱うと,[イベントコンソール]画面の[重要イベント]ページで,発生した重要イベントの一覧と,対処状況を管理することができます。

定期的に確認する通常イベント

ジョブの正常終了など,正常に動作しているイベントは,システムの運用要件によっては,次のように使われる場合があります。

  • JP1イベントを履歴として残したい。

    (例)ジョブ実行のJP1イベントを,ジョブ実行履歴として保管する。

  • JP1イベントを統計情報として利用したい。

    (例)ジョブ実行のJP1イベントの,実行開始および実行終了の項目を,ジョブ実行時間の統計情報として利用したい。

緊急度の高いイベント,重要イベントについては,JP1/IM - Viewに表示,CSV出力して,システム見直しなどの際に利用してください。

また,JP1/IMの監視対象外としているイベントについては,各ホストで,次のコマンドを使ってCSV出力して,利用してください。

  • JP1/Baseのjevexportコマンド

    イベントDBの内容をCSV出力する場合に利用してください。

  • JP1/IM - Managerのjcoevtreportコマンド

    統合監視DBの内容をCSV出力する場合に利用してください。

(3) セントラルスコープでの監視

セントラルスコープでは,表示される重要度を,カスタマイズすることができます。

監視ツリーでは,システム全体をツリーとして表示するため,監視対象同士の関連の把握が容易です。しかし,障害のイベントが発生すると,監視ツリーの構成によっては広範囲の監視オブジェクトが障害色になってしまいます。

監視オブジェクトの状態変更の契機は,デフォルトではJP1イベントの重大度と関連していますが,これを運用に合わせてカスタマイズすることができます。

また,監視オブジェクトを非監視にすることもできます。