1.5.2 トラブルの予兆を検知する流れとJP1/SLMを利用できるタイミング
ここでは,トラブルの予兆を検知する監視作業の流れの例と,JP1/SLMをどのタイミングで利用できるかについて説明します。
作業の概要を次に示します。
監視員がトラブルの予兆に気づき,特定のサービスの監視者に連絡する。
特定のサービスの監視者が状況を確認して,すべてのサービスの監視者に状況を報告して対処を依頼する。
すべてのサービスの監視者は,監視対象サービスの保守担当者,またはシステム管理者と連携して,トラブルの予兆に対処する。
トラブルの予兆を検知する作業の流れの例を次に示します。
図の流れについて説明します。JP1/SLMを利用できる作業については,該当する作業について記載しているマニュアルの参照先も合わせて示します。
項番 |
作業 |
JP1/SLMでできること |
作業の参照先 |
---|---|---|---|
1 |
監視員は,すべてのサービスの監視者から受けた指示に従って,JP1/SLMで特定の監視対象サービスを監視します。監視中にエラーまたは警告が発生した場合,自分たちで対処できるものは随時対処します。 |
[ホーム]画面で自分が担当している監視対象サービス全体の状況をまとめて確認できます。エラーまたは警告が表示された監視対象サービスは「要注意サービス」として確認できます。 要注意サービスで発生したイベントは,「過去7日間の発生イベント一覧」を確認できます。 |
|
2 |
監視員は,JP1/SLMで対処方法が不明のエラーまたは警告が発生していることを発見します。 |
||
3 |
監視員は,JP1/SLMで該当のエラーまたは警告が発生した監視対象サービスを特定します。 |
||
4 |
監視員は,特定のサービスの監視者に,エラーまたは警告が発生したことを電話などで報告します。 |
− |
− |
5 |
連絡を受けた特定のサービスの監視者は,JP1/SLMで該当のエラーまたは警告を確認します。 |
検出日時などを基に[ホーム]画面に表示された該当のエラーまたは警告を特定し,[詳細]列から[問題調査]画面を表示して内容を確認できます。 |
|
6 |
特定のサービスの監視者は,確認したエラーまたは警告の結果をすべてのサービスの監視者に報告します。 |
− |
− |
7 |
すべてのサービスの監視者と特定のサービスの監視者は,エラーまたは警告の要因を探るため,JP1/SLMで過去のエラーまたは警告の調査を実施します。また,エラーまたは警告の前後での操作のログや,製品のログおよびトレースを確認します。 |
[問題調査]画面で過去のサービス性能をさかのぼって確認し,エラーまたは警告が発生した時期を特定できます。 |
|
8 |
すべてのサービスの監視者は,原因がシステムとプログラムのどちらにありそうかを調査した結果を基に,監視対象サービスの保守担当者,またはシステム管理者に確認を依頼します。 |
JP1/PFMと連携している場合は,[問題調査]画面で構成情報を表示し,監視対象サービスを提供しているホストを確認できます。さらに,そのホストに関連するシステム性能で問題が発生していないかを調査できます。これによって,システム管理者に確認を依頼する必要があるかどうかを判断できます。 |
|
9 |
監視対象サービスの保守担当者は,JP1/SLMで過去の性能グラフなどを確認して,トラブルの予兆の発生契機と関連がありそうな事象を調査します。 |
[問題調査]画面で過去のサービス性能をさかのぼって確認し,エラーまたは警告が発生した時期のサービス性能とシステム性能の状態を確認できます。 |
|
10 |
監視対象サービスの保守担当者は,原因が特定できた場合は対処します。結果をすべてのサービスの監視者に報告します。 |
− |
− |
11 |
システム管理者は,システムに関する過去のデータを確認します。JP1/PFMを導入している場合は,確認にJP1/PFMの機能を利用できます。原因が特定できた場合は対処します。結果をすべてのサービスの監視者に報告します。 |
− |
− |
12 |
結果の報告を受けたすべてのサービスの監視者は,対処が完了していることを確認します。確認後,監視員に監視の再開を指示します。また,同件のエラーまたは警告が発生した場合の対処方法を監視員に伝達します。 |
− |
− |
(凡例)−:該当しない