JP1/Integrated Management - Rule Operation システム構築・運用ガイド
JP1/IM - RLおよびJP1/IM - View(ルールオペレーション・ビューアー)を使用するときに,一般的に想定できるトラブルについて,対処法を次に示します。
表13-9 一般的に想定できるトラブル
発生する契機 トラブル内容 ルールオペレーション・ビューアー起動時 ルールオペレーション・ビューアーからログインできない ルールオペレーション・ビューアーの画面が表示されない ルール起動時 ルールの起動対象となるJP1イベントが多発した ルール実行時 ルール実行状態が「終了状態不明」となる ルール実行が遅延する JP1/IM - RL起動時 JP1/IM - RLの起動に時間が掛かる
- <この節の構成>
- (1) ルールオペレーション・ビューアーからログインできない場合
- (2) ルールオペレーション・ビューアーの画面が表示されない場合
- (3) ルールの起動対象となるJP1イベントが多発した場合
- (4) ルールの実行状態が「終了状態不明」となる場合
- (5) ルールの実行が遅延する場合
- (6) JP1/IM - RLの起動に時間が掛かる場合
(1) ルールオペレーション・ビューアーからログインできない場合
出力されるメッセージの種類によって,対処方法が異なります。
(a) KAJX0100-Eメッセージが出力された場合
要因 対処法 JP1/IM - RLが起動されていません。 JP1/IM - RLを起動してください。 接続先ホスト名が誤っています。 接続先ホスト名が正しいか確認してください。 接続先ホストとの通信で何らかの異常が発生しています。 接続先ホストとの通信に問題がないか確認してください。
特に,ポート番号の設定を変更した場合は,システム内のポート番号の設定がすべて正しいか確認してください。(b) KAJX0101-Eメッセージが出力された場合
要因 対処法 接続先に対するユーザー名またはパスワードが誤っています。 接続先に対するユーザー名またはパスワードが正しいか確認してください。 ログインユーザーにJP1/IM - RLに対するJP1権限レベルが付与されていません。 ログインユーザーにJP1/IM - RLに対するJP1権限レベルを付与してください。 (c) KAJX0102-Eメッセージが出力された場合
要因 対処法 接続先ホスト上で設定されている認証サーバが起動されていません。 認証サーバを起動してください。
(2) ルールオペレーション・ビューアーの画面が表示されない場合
タスクバーにはルールオペレーション・ビューアーのタスクバーボタンが表示されているにもかかわらず,ルールオペレーション・ビューアーへのログイン後,ルールオペレーション・ビューアーの画面が表示されない場合,仮想画面構成※によって,ルールオペレーション・ビューアーが表示されていない画面領域を表示した状態で,ルールオペレーション・ビューアーを終了すると発生します。
- 注※
- メモリー上にディスプレイ画面以上のデスクトップを持って,分割したそれぞれの領域を仮想的に一つのデスクトップとして表示することで複数のデスクトップ画面を切り替えて使用できる構成のことをいいます。
- 仮想デスクトップともいいます。
このトラブルに対処するためには,ルールオペレーション・ビューアーのウィンドウを表示し,表示位置およびサイズを変更します。次のどれかの方法で対処してください。
- 選択したルールオペレーション・ビューアーのウィンドウ表示形態を変更する方法
- [Alt]キーを押したまま[Tab]キーを押して,ルールオペレーション・ビューアーを選択する。
- タスクバーから「重ねて表示」,「上下に並べて表示」,または「左右に並べて表示」を選択する。
- ルールオペレーション・ビューアーやそのほかのウィンドウの表示位置およびサイズを変更する。
- 選択したルールオペレーション・ビューアーのウィンドウを移動する方法
- [Alt]キーを押したまま[Tab]キーを押して,ルールオペレーション・ビューアーを選択する。
- ルールオペレーション・ビューアーのコンテキストメニューから「移動」を選択し,カーソルキーで位置を調整する。
- 表示されたウィンドウまたはそのウィンドウの枠の位置を決定したら,リターンキーを押す。
- ウィンドウを最大化してから再ログインする方法
- [Alt]キーを押したまま[Tab]キーを押して,ルールオペレーション・ビューアーを選択する。
- ルールオペレーション・ビューアーのコンテキストメニューから「最大化」を選択し,ウィンドウを最大化した状態でいったんログアウトする。
- 再ログインしたあと,ウィンドウの表示位置およびサイズを変更する。
(3) ルールの起動対象となるJP1イベントが多発した場合
システムのメンテナンスなどで,ルールの起動対象となるJP1イベントが多発した場合,ルールの実行処理が過負荷状態になるおそれがあります。
このトラブルを回避する方法は,次のとおりです。
- ルール起動要求を行う自動アクションを一時的に抑止する。
- 適用済みのルールの適用を一時的に解除する。
- JP1/IM - RLを停止する。
なお,自動アクションの抑止およびルールの適用解除を行っても状況回避できない場合だけ,JP1/IM - RLを停止してください。
(a) ルール起動要求を行う自動アクションを一時的に抑止
ルール起動要求を行う自動アクションを一時的に抑止して,状況が回復したあとで自動アクションの抑止を解除してください。
- セントラル・ビューアーの[イベントコンソール]画面から自動アクションを抑止状態にする手順
- [アクション設定]画面で実行を抑止する自動アクションを選択して,[アクション詳細設定]画面を開く。
- [アクション詳細設定]画面の[抑止]を[する]に変更したあと[抑止時間]を設定して,[OK]ボタンをクリックする。
- [アクション設定]画面に戻り,[適用]ボタンをクリックする。
自動アクションの抑止がシステムに反映されます。
[抑止時間]で設定した時間内に発生したルール起動対象イベントは,抑止した自動アクションでのルール起動処理の対象外となります。
サービスを停止させないで自動アクションの処理だけを抑止するため,クラスタ運用している場合にフェールオーバーさせないで運用を継続できます。
[抑止時間]で設定した時間内に状況が回復しない場合は,[アクション設定]画面での[適用]操作を再実行することで,[抑止時間]で設定した時間分,抑止状態を継続できます。
- 自動アクションの抑止状態を解除する手順
- [アクション詳細設定]画面で[抑止]を[しない]に設定する。
- [アクション設定]画面の[適用]ボタンをクリックする。
設定変更がシステムに反映されます。
(b) 適用済みのルール適用を一時的に解除
適用済みのルールを一時的に適用解除して,状況が回復したあとでルールを再度適用してください。
手順を次に示します。
- ルールオペレーション・ビューアーからルールの適用を解除する手順
- ルールオペレーション・ビューアーを起動する。
- [ルール運用]ページで適用解除するルールを選択する。
- [操作]−[ルールの適用解除]を選択して,適用解除状態にする。
この手順は,サービスを停止しないで,対象となるルールの起動だけを抑止します。このため,クラスタ運用している場合に,フェールオーバーしないで運用を継続できます。
- ルールを再度適用状態に戻す手順
- [ルール運用]ページで適用対象のルールを選択する。
- [操作]−[ルールの適用]を選択して,適用状態にする。
(c) JP1/IM - RLを停止する。
JP1/IM - RLを停止することでルールの起動を抑止後,状況が回復したあとでJP1/IM - RLを再起動してください。
この場合,JP1/IM - RLを停止するときに,ルールの実行状態が次の状態の場合,JP1/IM - RLの再起動後のルールの実行状態は「終了状態不明」になります。
- キューイング中
- 実行中
- 強制終了中
JP1/IM - RLを停止する場合,多発しているJP1イベント以外のJP1イベントに対するルールの実行も抑止されることになるため,システム全体の状況をよく判断したうえで実行してください。
(4) ルールの実行状態が「終了状態不明」となる場合
ルールインスタンスの実行中に次の現象が発生した場合,ルールの実行状態が「終了状態不明」となります。
- JP1/IM - RLを停止したあと再起動する。
- クラスタシステムでフェールオーバーが発生する。
このトラブルを解決するために,ルールオペレーション・ビューアーの[ルールモニタ]画面で「終了状態不明」となっているルールインスタンスを開いて,実行状態を確認します。未実行終了状態のルールエレメントがある場合,直前のルールエレメントの種別を確認します。
(a) ルール起動条件ルールエレメントが要因の場合
未実行終了状態のルールエレメントの直前のルールエレメントが,ルール起動条件ルールエレメントの場合,ルールは,「キューイング中」から「終了状態不明」に遷移しています。この場合,次の手順でルールを再実行できます。
- ルールオペレーション・ビューアーの[ルール監視]画面または[ルール実行履歴]画面で,終了状態不明のルールインスタンスを選択する。
- ポップアップメニューの[再実行]を選択する。
(b) ルール起動条件ルールエレメント以外のルールエレメントが要因の場合
未実行終了状態のルールエレメントの直前のルールエレメントが,ルール起動条件ルールエレメント以外のルールエレメントの場合,ルールは「実行中」または「強制終了中」から「終了状態不明」に遷移しています。ルール内のルールエレメントに再実行できないものがある場合,次の手順で対処してください。
- ルールオペレーション・ビューアーの[ルールモニタ]画面で終了したルールインスタンスの状態を確認する。
- 終了状態不明のコマンド実行ルールエレメントがある場合,そのルールエレメントでのコマンドの実行先ホスト上で実行対象コマンドの実行状態を確認する。
- 未実行終了状態のルールエレメントの定義内容に従って,コマンドの実行を手作業で実施する。
なお,ルール内のルールエレメントをすべて再実行しても問題がない場合は,「13.5(4)(a) ルール起動条件ルールエレメントが要因の場合」を参照して,ルールを再実行してください。
(c) 未実行終了状態のルールエレメントがない場合
未実行終了状態のルールエレメントがない場合,ルールの定義に含まれる終端のコマンド実行ルールエレメントまたは対処(コマンド)ルールエレメントの実行中に「終了状態不明」に遷移しています。次の手順で対処してください。
- ルールオペレーション・ビューアーの[ルールモニタ]画面で終了状態不明となっているルールインスタンスの状態を確認する。
- 終了状態不明のコマンド実行ルールエレメントまたは対処(コマンド)ルールエレメントでのコマンドの実行先ホスト上で実行対象コマンドの実行状態を確認する。
- コマンドが異常終了している場合,ルールエレメントの定義内容に従って,コマンドの実行を手作業で実施する。
(5) ルールの実行が遅延する場合
ルールインスタンスの実行状態が「キューイング中」または「実行中」のままとなり,ルールインスタンスが終了しない。
まず,ルールオペレーション・ビューアーの[ルール監視]画面で,システム全体でのルールの実行状態を確認し,次の状態のルールインスタンスの数を調査してください。
- 判断待ち
- 実行中
- キューイング中
各状態のルールインスタンスの数による対処を次に示します。
(a) 「判断待ち」状態のルールインスタンスが20個ある場合
「判断待ち」のルールインスタンスが20個ある場合,ほかの状態のルールインスタンスは実行されません。
「判断待ち」のルールインスタンスをルールオペレーション・ビューアーの[ルールモニタ]画面で表示して,対処指示を実行してください。
(b) 「実行中」状態のルールインスタンスが複数個ある場合
- 複数のルール間で資源が競合している場合
「実行中」のルールインスタンスが複数個存在して,それぞれのルールインスタンスが,あるルールエレメントの実行中のまま,処理が停止しているように見える場合,複数のルール間で資源が競合しているおそれがあります。
この場合の対処を次に示します。
- 競合するルールインスタンスを強制終了させたあと,競合しないように順番にルールを再実行する。
- 複数のルール間で資源が競合しないよう,ルールの定義内容を見直す。
- ホスト内で同時に実行しているコマンドの数が制限値に達している場合
複数のルールインスタンスに含まれるコマンド実行ルールエレメントおよび対処(コマンド)ルールエレメントで定義したコマンドの実行先ホストが同一である場合,同時実行数が5を超えると6個目以降のコマンドの実行は先行するコマンドが完了するまで待ち状態になります。
この場合の対処を次に示します。
- 先行するコマンドの処理状態を確認して,時間が掛かる要因を取り除く
- ルールインスタンスを同時に実行しても特定のホストに実行が集中しないように,ルールの定義またはシステム構成を見直す
(c) あるルールインスタンスだけが「実行中」のままである場合
終了しないコマンドまたは時間が掛かるコマンドが実行されています。この場合の対処手順を次に示します。
- 「実行中」のルールインスタンスをルールオペレーション・ビューアーの[ルールモニタ]画面で表示する
ルールインスタンスの状態を確認してください。
- コマンド実行ルールエレメントまたは対処(コマンド)ルールエレメントが実行中のままである場合,ルールエレメントで定義しているコマンドの実行先ホストの状態を調査し,コマンドの処理内容や資源が競合したかどうかを確認する
(6) JP1/IM - RLの起動に時間が掛かる場合
JP1/IM - RLの起動時,Windowsの[サービス コントロール マネージャ]に次のメッセージが表示されることがあります。
ローカルコンピュータのJP1/RuleManagerサービスを起動できません。エラー:1053 のサービスは指定時間内に開始要求または制御要求に応答しませんでした。この現象は,次の状態のどれかが重なった場合に発生します。
- 適用済みのルールが多い
- 前回のJP1/IM - RLの停止時に,実行中のルールインスタンスが多い
- ルール実行結果の数が多い
この現象が発生した場合,JP1/IM - RLの起動処理は継続していますので,次のどちらかの手順で,サービスの起動が完了したどうか確認してください。
- Windowsの[イベント ビューア]で,JP1/IM - RLの起動完了を確認する場合
KAJX8026-Iメッセージが出力されていれば,サービスの起動は完了しています。
- Windowsの[サービス コントロール マネージャ]で,JP1/IM - RLの起動完了を確認する場合
[サービス コントロール マネージャ]の[最新の情報に更新]ボタンをクリックして,JP1/IM - RLの状態が「開始」になっていれば,サービスの起動は完了しています。
All Rights Reserved. Copyright (C) 2006, 2008, Hitachi, Ltd.