Hitachi

JP1 Cloud Service システム管理 利用ガイド


4.1.2 監視サービスにおけるパフォーマンスデータの管理(V02-00以降)

監視対象のパフォーマンスデータの取得や閾値監視(アラートイベント)などを一元管理する機能を提供します。提供する機能は以下となります。

#

機能

内容

1

スクレイプ機能

Prometheus serverがExporterを経由して監視対象のパフォーマンスデータを取得する機能を提供します。

Prometheus serverがExporterの特定のURLにアクセスし,Exporterが監視対象のパフォーマンスデータを取得してPrometheus serverに返却するまでの処理をスクレイプと呼びます。

Prometheus serverがスクレイプによりExporterから取得するメトリックはExporterによって異なるスクレイプの定義を変更した後は,Prometheus serverの定義ファイルのリロードを行うか,Prometheus serverを再起動する必要があります。

2

稼働情報の取得機能(Exporter)

監視対象からパフォーマンスデータを取得する機能を提供します。

本機能は,スクレイプ機能によってPrometheus Serverから送られるスクレイプ要求により,監視対象からパフォーマンスデータを収集してPrometheusに結果を返します。

Exporterの主な取得項目についてはメトリックの定義ファイル(初期設定)で定義します。

3

リモートライト機能

Prometheus serverが収集したパフォーマンスデータを外部の長期保存に適したデータベースに送信するリモートライト機能を提供します。

この機能を利用しパフォーマンスデータをシステム管理マネージャーに送信し,データを格納します。

リモートライトの定義を変更した後は,Prometheus serverの定義ファイルのリロードを行うか,Prometheus serverを再起動する必要があります。

4

アラート評価機能

収集したパフォーマンスデータを閾値監視する機能を提供します。

アラートルールを定義することによりパフォーマンスデータを閾値監視し,アラートを通知することが可能となります。

アラートルールの定義を変更した後は,Prometheus serverの定義ファイルのリロードを行うか,Prometheus serverを再起動する必要があります。

5

アラート通知機能

Prometheus serverでアラートを評価したあと,アラートがfiring状態(アラートルールに該当してから一定期間が経過した状態),またはresolved状態(アラートルールに該当しなくなった状態)になったときに通知を行う機能を提供します。

アラートの通知先の定義を変更した後は,Prometheus serverの定義ファイルのリロードを行うか,Prometheus serverとAlertmanagerを再起動する必要があります。

6

通知抑止機能(サイレンス機能)

一時的に特定の通知を抑止する機能を提供します。一時的なメンテナンスを行う場合などで,その間に発生しうるアラートを通知しないように設定することが可能となります。

JP1/IM3の共通除外条件を使用する場合と異なり,通知抑止機能ではJP1/IM3へ通知自体を行いません。

サイレンスが有効である間は,アラートの状態が変わっても通知が行われない,サイレンスが無効になったときサイレンス有効化前のアラートの状態と比較して状態が変わっていれば通知が行われる,という動作となります。

サイレンスの設定(有効化/無効化),および現在のサイレンスの設定を取得する手段として,REST APIを提供します。

7

統合エージェント制御基盤(imagent/imagentproxy)の機能

Prometheus Serverからリモートライトされたパフォーマンスデータ,AlertManagerからアラート通知されたアラートイベントのHTTPリクエストを受信し,電文をimagentから統合エージェント管理基盤のimbaseに転送します。

8

統合エージェント管理基盤(imbase/imbaseproxy)の機能

統合エージェント制御基盤(imagent)から受信したHTTPリクエストに記載されたサービス種別からJP1/IM3-Managerのサービスポートを求め,各サービス(promscaleやIMDD)にリクエストを振り分けることで,パフォーマンスデータやアラート通知のJP1イベントの格納が実行されます。

9

トレンドデータ書き込みAPI(JP1/IM3のREST API)

監視エージェントが収集したパフォーマンスデータを,システム管理マネージャーのデータベースに保存するためのREST APIです。保存したデータはトレンド情報として参照することが可能となります。

10

JP1イベント変換API(JP1/IM3のREST API)

監視エージェントが発行したアラートをJP1イベントに変換するためのAPIです。変換されたJP1イベントはシステム管理マネージャーに保存され,統合オペレーション・ビューアーで参照することができます。