14.1.10 イベントガイドの検討
イベントガイドは,調査方法,対策方法,過去の事例などのノウハウをメッセージとして定義し蓄積することで,原因調査や問題対策の作業を支援する機能です。
システム管理者は,JP1イベント監視による問題検知,要因調査,対策という一連の流れでシステムを管理します。問題対策が完了したあと,経験や実績をイベントガイド情報として蓄積することで,同じ内容のJP1イベントの発生時に迅速に対処できます。
イベントガイド情報は,セントラルコンソールおよび統合オペレーション・ビューアーの[イベント詳細]画面で,JP1イベントの詳細情報の一つとして表示されます。
JP1イベント一つに対しては,一つのイベントガイド情報を表示できます。しかし,連携するJP1製品,各種ユーザーアプリケーションから発行されるJP1イベントの数はシステムの規模に比例して多くなります。以降の説明を参考に,イベントガイドを設定するよう検討してください。
- 〈この項の構成〉
(1) JP1イベントを絞り込んでイベントガイドを設定する
JP1イベントは多様であり,その数もシステムの規模に応じて多くなります。そのすべてにイベントガイド情報を設定することは容易ではありませんし,また,設定できるのは1,000件までという制限もあります。
したがって,イベントガイド情報を設定するJP1イベントは,絞り込む必要があります。例えば,次のような観点で絞り込んでください。
(a) 重大度により,設定するJP1イベントを絞り込む
JP1イベントの重大度には「緊急」「警戒」「致命的」「エラー」「警告」「通知」「情報」および「デバッグ」があります。管理対象が発行するJP1イベントにもよりますが,重大度の高いJP1イベント(「エラー」など)から,イベントガイド情報を登録するようにしてください。
統合監視DBを使用した場合,JP1イベントの重大度は,ユーザーが定義した重大度となります。
デフォルトの設定では,エージェントのJP1/Baseからマネージャーに転送されるJP1イベントの重大度は,「緊急」「警戒」「致命的」「エラー」および「警告」です。
(b) 発生頻度の集計,対処までの緊急性から,設定するJP1イベントを絞り込む
イベント検索やJP1/Baseのjevexportコマンドを使って,管理対象ホストでどのようなJP1イベントが発行されているのかを集計,確認します。集計の結果から,問題のあるJP1イベントが高い頻度で発行されている場合,そのJP1イベントを発行したホスト,および発生から問題対処までの緊急性の観点でJP1イベントを絞り込むことができます。
緊急対処が必要なJP1イベントが,高い頻度で発行されている場合には,システム管理者,オペレーターなどの間で,問題対処の手順を取り決めておく必要があります。このようなJP1イベントに対して,イベントガイド情報を設定するようにしてください。
なお,jevexportコマンドの詳細については,マニュアル「JP1/Base 運用ガイド」のコマンドの章を参照してください。
- 重要
-
イベントガイド情報の設定には,1,000件という制限があります。JP1イベントに優先度を付けて,必ず絞り込みをしてください。
なお,JP1イベントを1,000件以内に絞り込むことが困難な場合,例えば次のような対処を検討してください。
-
類似のイベント,または関連するイベントをグループ化するなどして,イベントガイドメッセージにリンク先の一覧を記述する(INDEXページとして利用する)。
なお,この場合には参照したいアドバイスをリンク先にある一覧から検索する必要があるため,編集の際のルールを明確にし,検索性に優れた一覧にするなどの工夫をしてください。
-
(2) 運用方法に合わせてイベントガイドを設定する
イベントガイド情報には,任意の情報を表示できるため,運用方法に合わせた設定ができます。運用方法に合わせたイベントガイド情報とは,例えば次のようなものがあります。
-
初動対応についてのイベントガイド情報
JP1イベントにより検知した問題をどのように対処するかを提示して,問題が発生した際の初期動作を管理者に案内する。これをイベントガイド情報として設定する。
-
問題の調査,対処手順についてのイベントガイド情報
まず,JP1イベントにより検知した問題に対して,要因の調査手順をJP1/IMのどの機能を使って行うのか提示する。次に問題の対処手順について記載する。これらをイベントガイド情報として設定する。
また,緊急対処が必要な「エラー」などのJP1イベントに対しては初動対応を,事前対処で問題発生を防げる場合がある「警告」などのJP1イベントに対しては要因調査および対処手順を,といったようにそれぞれのJP1イベントの内容に応じて,イベントガイド情報を使い分けることもできます。
(a) 初動対応についてのイベントガイド情報(例)
管理対象ホストで稼働するJP1/AJSのジョブの異常終了イベントに対して,イベントガイド情報を設定する例について説明します。
ジョブの異常終了イベントは,イベントID(B.ID):00004107,重大度(E.SEVERITY):Errorです。このJP1イベントに,イベントガイド情報を設定する場合は,次のようになります。
- イベントガイド情報ファイル(jco_guide.txt)に設定する内容例
-
(条件定義部分の抜粋)
[EV_GUIDE_001]
EV_COMP=B.ID:00004107:00000000
EV_COMP=E.SEVERITY:Error
EV_GUIDE=ジョブが異常終了しました。\n $E.C0 のホストに常駐しているシステム管理者に至急連絡してください。 \n\n システム管理者連絡先一覧 \n ホストA:TEL(03-xxxx-xxxx) Mail(xxxxx@xxx.co.jp) \n ホストB:TEL(03-xxxx-xxxx) Mail(xxxxx@xxx.co.jp) \n ホストC:TEL(03-xxxx-xxxx) Mail(xxxxx@xxx.co.jp)
[END]
(b) 問題の調査,対処手順についてのイベントガイド情報(例)
エージェントで稼働するJP1/Baseで,コマンド実行の先行入力数の閾値超過イベントに対して,イベントガイド情報を設定する例について説明します。
コマンド実行の先行入力数の閾値超過イベントは,イベントID:00003FA5,重大度(E.SEVERITY):Warningです。このJP1イベントに,イベントガイド情報を設定する場合は,次のようになります。
- イベントガイド情報ファイル(jco_guide.txt)に設定する内容例
-
(条件定義部分の抜粋)
[EV_GUIDE_002]
EV_COMP=B.IDBASE:00003FA5
EV_COMP=E.SEVERITY:Warning
EV_FILE=任意のフォルダ(パス)\jco_guidemes_002.txt
[END]
- イベントガイドメッセージファイル(jco_guidemes_002.txt)に記述する内容例
-
コマンドが先行入力数の閾値10件を超えています。
メッセージの内容から,JP1/Baseのホストを判断してください。
ホストのメモリー不足などが原因なのか,キューに自動アクションが詰まっていないか,など確認してください。
[アクション結果一覧]画面を開いたり,jcashowa,jcocmdshowコマンドを実行したりして,自動アクションの状態を確認できます。
至急実行が必要な自動アクションが実行待ちになっている場合,一時対処として自動アクションをキャンセルすることもできます。
jcacancel,jcocmddelコマンドで自動アクションをキャンセルしてください。
なお,jcacancel,jcocmddelコマンドはy/nを確認します。[コマンド実行]画面から実行する場合には,-fオプションで確認を省略してください。
このイベントが頻繁に発行される場合は,jcocmddefコマンドを使用して,コマンドの実行環境を調整してください。
(3) 変数(置き換え文字列)を使用してイベントガイドを設定する
イベントガイドメッセージには,JP1イベントの属性を変数(置き換え文字列)として使用することができます。例えば,問題が発生したホスト名(B.SOURCESERVER)を変数にすることで,イベントガイド情報に変数を通じてホスト名が表示されるため,状況に応じたガイドを表示できます。これによって,問題が発生したホストを特定するまでの時間を短縮できます。
次にイベントガイドメッセージに使用できる変数を一覧で示します。
イベントの属性 |
変数 |
置き換えの 形式 |
|
---|---|---|---|
基本属性 |
イベントDB内通し番号 |
B.SEQNO |
整数値の文字列 |
イベントID |
次の2とおり
|
次の形式の文字列
|
|
発行元プロセスID |
B.PROCESSID |
整数値の文字列 |
|
登録時刻 |
B.TIME |
||
到着時刻 |
B.ARRIVEDTIME |
||
発行元ユーザーID |
B.USERID |
||
発行元グループID |
B.GROUPID |
||
発行元ユーザー名 |
B.USERNAME |
文字列 |
|
発行元グループ名 |
B.GROUPNAME |
||
発行元イベントサーバ名 |
B.SOURCESERVER |
||
送信先イベントサーバ名 |
B.DESTSERVER |
||
発行元イベントDB内通し番号 |
B.SOURCESEQNO |
整数値の文字列 |
|
メッセージ |
B.MESSAGE |
文字列 |
|
拡張属性 |
重大度 |
E.SEVERITY |
|
ユーザー名 |
E.USER_NAME |
||
プロダクト名 |
E.PRODUCT_NAME |
||
オブジェクトタイプ |
E.OBJECT_TYPE |
||
オブジェクト名 |
E.OBJECT_NAME |
||
登録名タイプ |
E.ROOT_OBJECT_TYPE |
||
登録名 |
E.ROOT_OBJECT_NAME |
||
オブジェクトID |
E.OBJECT_ID |
||
事象種別 |
E.OCCURRENCE |
||
開始時刻 |
E.START_TIME |
||
終了時刻 |
E.END_TIME |
||
終了コード |
E.RESULT_CODE |
||
発生元ホスト名 |
E.JP1_SOURCEHOST |
||
上記以外の拡張属性 |
E.xxxxxxx※ |
これら変数を使えば,より汎用的なイベントガイドメッセージが記述できます。例えば,JP1/AJSのジョブの実行ホスト(E.C0)を使用して,イベントガイドメッセージを記述する場合,次のように記述します。
- 変数を使ったイベントガイドメッセージの記述例(EV_GUIDE部分の抜粋)
-
EV_GUIDE=ジョブが異常終了しました。\n $E.C0 のホストで異常が発生していないか確認してください。\n 以前の障害例として,ホストAではメモリー不足によりジョブが失敗したことがあります。\n vmstatコマンドでメモリーの空き容量を確認してください。
ガイド情報の形式がHTML形式の場合は,HTML形式で出力されます。また,置き換えるJP1イベントの属性値をURLエンコード,またはBase64エンコードすることで,連携製品のWWWページなどを文字化けすることなく表示できます。置き換え方法については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「イベントガイド情報ファイル(jco_guide.txt)」(2. 定義ファイル)を参照してください。
JP1イベントの属性についての詳細については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「3.1 JP1イベントの属性」を参照してください。
なお,JP1イベントの属性(変数)として置き換えられる文字列は,各製品によって異なります。変数を使用する場合は,各製品のマニュアルのJP1イベントの説明も合わせて参照してください。
(4) 表示対象ユーザーごとにイベントガイドを設定する
イベントガイドメッセージは,表示対象ユーザー(EV_USER)ごとに設定できます。同じJP1イベントでも,表示対象ユーザーを設定することで,システム管理者向けのイベントガイドメッセージを設定したり業務グループ向けのイベントガイドメッセージを指定したりできます。
1件のイベントガイドメッセージに対して,最大100個のJP1ユーザーを表示対象ユーザーとして指定できます。イベントガイド情報ファイル(jco_guide.txt)に設定する例を次に示します。
- イベントガイド情報ファイル(jco_guide.txt)に設定する例
-
(条件定義部分の抜粋)
[EV_GUIDE_002]
EV_USER=jp1user1 jp1user2 jp1user3
EV_COMP=B.IDBASE:00003FA5
EV_COMP=E.SEVERITY:Warning
EV_FILE=任意のフォルダ(パス)\jco_guidemes_002.txt
[END]