11.1.7 イベントガイドの検討

イベントガイドは,調査方法,対策方法,過去の事例などのノウハウをメッセージとして定義し蓄積することで,原因調査や問題対策の作業を支援する機能です。

システム管理者は,JP1イベント監視による問題検知,要因調査,対策という一連の流れでシステムを管理します。問題対策が完了したあと,経験や実績をイベントガイド情報として蓄積することで,同じ内容のJP1イベントの発生時に迅速に対処できます。

イベントガイド情報は,セントラルコンソールの[イベント詳細]画面で,JP1イベントの詳細情報の一つとして表示されます。

JP1イベント一つに対しては,一つのイベントガイド情報を表示できます。しかし,連携するJP1製品,各種ユーザーアプリケーションから発行されるJP1イベントの数はシステムの規模に比例して多くなります。以降の説明を参考に,イベントガイドを設定するよう検討してください。

<この項の構成>
(1) JP1イベントを絞り込んでイベントガイドを設定する
(2) 運用方法に合わせてイベントガイドを設定する
(3) 変数(置き換え文字列)を使用してイベントガイドを設定する
(4) 表示対象ユーザーごとにイベントガイドを設定する

(1) JP1イベントを絞り込んでイベントガイドを設定する

JP1イベントは多様であり,その数もシステムの規模に応じて多くなります。そのすべてにイベントガイド情報を設定することは容易ではありませんし,また,設定できるのは1,000件までという制限もあります。

したがって,イベントガイド情報を設定するJP1イベントは,絞り込む必要があります。例えば,次のような観点で絞り込んでください。

(a) 重大度により,設定するJP1イベントを絞り込む

JP1イベントの重大度には「緊急」「警戒」「致命的」「エラー」「警告」「通知」「情報」および「デバッグ」があります。管理対象が発行するJP1イベントにもよりますが,重大度の高いJP1イベント(「エラー」など)から,イベントガイド情報を登録するようにしてください。

統合監視DBを使用した場合,JP1イベントの重大度は,ユーザーが定義した重大度となります。

デフォルトの設定では,エージェントのJP1/Baseからマネージャーに転送されるJP1イベントの重大度は,「緊急」「警戒」「致命的」「エラー」および「警告」です。

(b) 発生頻度の集計,対処までの緊急性から,設定するJP1イベントを絞り込む

イベント検索やJP1/Baseのjevexportコマンドを使って,管理対象ホストでどのようなJP1イベントが発行されているのかを集計,確認します。集計の結果から,問題のあるJP1イベントが高い頻度で発行されている場合,そのJP1イベントを発行したホスト,および発生から問題対処までの緊急性の観点でJP1イベントを絞り込むことができます。

緊急対処が必要なJP1イベントが,高い頻度で発行されている場合には,システム管理者,オペレーターなどの間で,問題対処の手順を取り決めておく必要があります。このようなJP1イベントに対して,イベントガイド情報を設定するようにしてください。

なお,jevexportコマンドの詳細については,マニュアル「JP1/Base 運用ガイド」のコマンドの章を参照してください。

注意
イベントガイド情報の設定には,1,000件という制限があります。JP1イベントに優先度を付けて,必ず絞り込みをしてください。
なお,JP1イベントを1,000件以内に絞り込むことが困難な場合,例えば次のような対処を検討してください。
  • 類似のイベント,または関連するイベントをグループ化するなどして,イベントガイドメッセージにリンク先の一覧を記述する(INDEXページとして利用する)。
なお,この場合には参照したいアドバイスをリンク先にある一覧から検索する必要があるため,編集の際のルールを明確にし,検索性に優れた一覧にするなどの工夫をしてください。

(2) 運用方法に合わせてイベントガイドを設定する

イベントガイド情報には,任意の情報を表示できるため,運用方法に合わせた設定ができます。運用方法に合わせたイベントガイド情報とは,例えば次のようなものがあります。

また,緊急対処が必要な「エラー」などのJP1イベントに対しては初動対応を,事前対処で問題発生を防げる場合がある「警告」などのJP1イベントに対しては要因調査および対処手順を,といったようにそれぞれのJP1イベントの内容に応じて,イベントガイド情報を使い分けることもできます。

(a) 初動対応についてのイベントガイド情報(例)

管理対象ホストで稼働するJP1/AJSのジョブの異常終了イベントに対して,イベントガイド情報を設定する例について説明します。

ジョブの異常終了イベントは,イベントID(B.ID):00004107,重大度(E.SEVERITY):Errorです。このJP1イベントに,イベントガイド情報を設定する場合は,次のようになります。

イベントガイド情報ファイル(jco_guide.txt)に設定する内容例
(条件定義部分の抜粋)
[EV_GUIDE_001]
EV_COMP=B.ID:00004107:00000000
EV_COMP=E.SEVERITY:Error
EV_GUIDE=ジョブが異常終了しました。¥n $E.C0 のホストに常駐しているシステム管理者に至急連絡してください。 ¥n¥n システム管理者連絡先一覧 ¥n ホストA:TEL(03-xxxx-xxxx) Mail(xxxxx@xxx.co.jp) ¥n ホストB:TEL(03-xxxx-xxxx) Mail(xxxxx@xxx.co.jp) ¥n ホストC:TEL(03-xxxx-xxxx) Mail(xxxxx@xxx.co.jp)
[END]

(b) 問題の調査,対処手順についてのイベントガイド情報(例)

エージェントで稼働するJP1/Baseで,コマンド実行の先行入力数の閾値超過イベントに対して,イベントガイド情報を設定する例について説明します。

コマンド実行の先行入力数の閾値超過イベントは,イベントID:00003FA5,重大度(E.SEVERITY):Warningです。このJP1イベントに,イベントガイド情報を設定する場合は,次のようになります。

イベントガイド情報ファイル(jco_guide.txt)に設定する内容例
(条件定義部分の抜粋)
[EV_GUIDE_002]
EV_COMP=B.IDBASE:00003FA5
EV_COMP=E.SEVERITY:Warning
EV_FILE=任意のフォルダ(パス)¥jco_guidemes_002.txt
[END]
イベントガイドメッセージファイル(jco_guidemes_002.txt)に記述する内容例
コマンドが先行入力数の閾値10件を超えています。
メッセージの内容から,JP1/Baseのホストを判断してください。
ホストのメモリー不足などが原因なのか,キューに自動アクションが詰まっていないか,など確認してください。
[アクション結果一覧]画面を開いたり,jcashowa,jcocmdshowコマンドを実行したりして,自動アクションの状態を確認できます。
至急実行が必要な自動アクションが実行待ちになっている場合,一時対処として自動アクションをキャンセルすることもできます。
jcacancel,jcocmddelコマンドで自動アクションをキャンセルしてください。
なお,jcacancel,jcocmddelコマンドはy/nを確認します。[コマンド実行]画面から実行する場合には,-fオプションで確認を省略してください。
このイベントが頻繁に発行される場合は,jcocmddefコマンドを使用して,コマンドの実行環境を調整してください。

(3) 変数(置き換え文字列)を使用してイベントガイドを設定する

イベントガイドメッセージには,JP1イベントの属性を変数(置き換え文字列)として使用することができます。例えば,問題が発生したホスト名(B.SOURCESERVER)を変数にすることで,イベントガイド情報に変数を通じてホスト名が表示されるため,状況に応じたガイドを表示できます。これによって,問題が発生したホストを特定するまでの時間を短縮できます。

次にイベントガイドメッセージに使用できる変数を一覧で示します。

表11-4 イベントガイドメッセージに使用できる変数の一覧

イベントの属性変数置き換えの
形式
基本属性イベントDB内通し番号B.SEQNO整数値の文字列
イベントID次の2とおり
  1. B.ID
  2. B.IDBASE
次の形式の文字列
  1. 基本部:拡張部
  2. 基本部
発行元プロセスIDB.PROCESSID整数値の文字列
登録時刻B.TIME
到着時刻B.ARRIVEDTIME
発行元ユーザーIDB.USERID
発行元グループIDB.GROUPID
発行元ユーザー名B.USERNAME文字列
発行元グループ名B.GROUPNAME
発行元イベントサーバ名B.SOURCESERVER
送信先イベントサーバ名B.DESTSERVER
発行元イベントDB内通し番号B.SOURCESEQNO整数値の文字列
メッセージB.MESSAGE文字列
拡張属性重大度E.SEVERITY
ユーザー名E.USER_NAME
プロダクト名E.PRODUCT_NAME
オブジェクトタイプE.OBJECT_TYPE
オブジェクト名E.OBJECT_NAME
登録名タイプE.ROOT_OBJECT_TYPE
登録名E.ROOT_OBJECT_NAME
オブジェクトIDE.OBJECT_ID
事象種別E.OCCURRENCE
開始時刻E.START_TIME
終了時刻E.END_TIME
終了コードE.RESULT_CODE
発生元ホスト名E.JP1_SOURCEHOST
上記以外の拡張属性E.xxxxxx

注※ 各JP1製品固有の拡張属性も使用できます。例えば,JP1/AJSのジョブの実行ホストは,E.C0です。製品固有の拡張属性についての詳細は,JP1イベントを発行する各製品のマニュアルを参照してください。


これら変数を使えば,より汎用的なイベントガイドメッセージが記述できます。例えば,JP1/AJSのジョブの実行ホスト(E.C0)を使用して,イベントガイドメッセージを記述する場合,次のように記述します。

変数を使ったイベントガイドメッセージの記述例(EV_GUIDE部分の抜粋)
EV_GUIDE=ジョブが異常終了しました。¥n $E.C0 のホストで異常が発生していないか確認してください。¥n 以前の障害例として,ホストAではメモリー不足によりジョブが失敗したことがあります。¥n vmstatコマンドでメモリーの空き容量を確認してください。

ガイド情報の形式がHTML形式の場合は,HTML形式で出力されます。また,置き換えるJP1イベントの属性値をURLエンコード,またはBase64エンコードすることで,連携製品のWWWページなどを文字化けすることなく表示できます。置き換え方法については,マニュアル「JP1/Integrated Management - Manager コマンド・定義ファイルリファレンス」の「イベントガイド情報ファイル(jco_guide.txt)」(2. 定義ファイル)を参照してください。

JP1イベントの属性についての詳細については,マニュアル「JP1/Integrated Management - Manager コマンド・定義ファイルリファレンス」の「3.1 JP1イベントの属性」を参照してください。

なお,JP1イベントの属性(変数)として置き換えられる文字列は,各製品によって異なります。変数を使用する場合は,各製品のマニュアルのJP1イベントの説明も合わせて参照してください。

(4) 表示対象ユーザーごとにイベントガイドを設定する

イベントガイドメッセージは,表示対象ユーザー(EV_USER)ごとに設定できます。同じJP1イベントでも,表示対象ユーザーを設定することで,システム管理者向けのイベントガイドメッセージを設定したり業務グループ向けのイベントガイドメッセージを指定したりできます。

1件のイベントガイドメッセージに対して,最大100個のJP1ユーザーを表示対象ユーザーとして指定できます。イベントガイド情報ファイル(jco_guide.txt)に設定する例を次に示します。

イベントガイド情報ファイル(jco_guide.txt)に設定する例
(条件定義部分の抜粋)
[EV_GUIDE_002]
EV_USER=jp1user1 jp1user2 jp1user3
EV_COMP=B.IDBASE:00003FA5
EV_COMP=E.SEVERITY:Warning
EV_FILE=任意のフォルダ(パス)¥jco_guidemes_002.txt
[END]