Hitachi

JP1 Version 13 JP1/Integrated Management 3 - Manager 運用ガイド


12.5.2 主な入力ミスに対して発生する現象と回復方法

〈この項の構成〉

(1) Prometheus serverのスクレイプ先に不正なホストやポートを指定した

現象

スクレイプが失敗し,upメトリックが0として収集される。

スクレイプ先の設定を誤ったPrometheus server経由で取得するデータに関して,統合オペレーション・ビューアーのトレンド情報に,最新の情報が表示されない。

回復方法

スクレイプの定義を修正して,Prometheus serverをリロードまたは再起動してください。

(2) Prometheus serverのリモートライト先に不正なホストやポートを指定した

現象

リモートライト先の設定を誤ったPrometheus server経由で取得するデータに関して,統合オペレーション・ビューアーのトレンド情報に,最新の情報が表示されない。

回復方法

リモートライトの定義を修正して,Prometheus serverをリロードまたは再起動してください。

(3) Prometheus serverのアラート通知先に不正なホストやポートを指定した

現象

アラート通知先の設定を誤ったPrometheus serverから発生するアラートに関して,統合オペレーション・ビューアーのJP1イベント一覧に,最新の情報が表示されない。

回復方法

通知先の定義を修正して,Prometheus serverをリロードまたは再起動してください。

(4) Alertmanagerの通知先に不正なホストやポートを指定した

現象

通知先の設定を誤ったAlertmanagerから送信するアラートに関して,統合オペレーション・ビューアーのJP1イベント一覧に,最新の情報が表示されない。

回復方法

通知先の定義を修正して,Alertmanagerをリロードまたは再起動してください。

(5) Blackbox exporterの監視先に不正なホストやポートを指定した

現象

監視先の情報取得に失敗し,probe_successメトリックが0として収集される。

回復方法

監視先のホストやポートの定義を修正して,Prometheus serverをリロードまたは再起動してください。

(6) Prometheus serverの定義ファイルの書式が不正

現象

Prometheus serverのリロードのAPIを実行したとき,ステータスコード500が返却され,次のようなメッセージが表示される。

failed to reload config: couldn't load configuration (--config.file="ファイルのパス"): parsing YAML file ファイルのパス: yaml: unmarshal errors:  line 行数: field test not found in type config.plain
回復方法

メッセージに出力されているファイルのパス行数を確認し,定義を修正して,Prometheus serverをリロードまたは再起動してください。

(7) ディスカバリ設定ファイルの書式が不正

現象

jddcreatetreeコマンドおよびjddupdatetreeコマンドの実行に成功したにも関わらず,ディスカバリ設定ファイルに記述した情報のIM管理ノードが統合オペレーション・ビューアーに表示されない。

回復方法

コロンの指定や半角スペースの数が合っているかなど,ディスカバリ設定ファイルの書式が誤っていないかを確認してください。誤りを訂正したあと,再度jddcreatetreeコマンドおよびjddupdatetreeコマンド(構成変更モード(-cオプション)を指定)を実行してください。

(8) ログ監視共通定義ファイルの書式が不正

現象

ログ監視共通定義ファイル(jpc_fluentd_common.conf)の,<buffer>ディレクティブ内のpathパラメーターに対して,256バイトを超えるパス名が指定されている場合,または,Windows環境で,: , ; * ? " < > | とタブ・スペースを含むパスが指定されている場合に,fluentdのログに,次のようなエラーが繰り返して出力され続ける。

unexpected error error_class=Errno::ENOENT error="No such file or directory @ dir_s_mkdir - ディレクトリ名 "
回復方法

ログ監視共通定義ファイル(jpc_fluentd_common.conf)の,<buffer>ディレクティブ内のpathパラメーターの値について,書式と設定内容が誤ってないかを確認してください。

(9) テキスト形式のログファイルの監視定義ファイルの書式が不正

現象

テキスト形式のログファイルの監視定義ファイル(fluentd_@@trapname@@_tail.conf)の,[Input Settings]セクション内のpos_fileパラメーターに対して,空白,または,OSのファイル名の上限値を超える文字列が指定されている場合に,fluentdのログに,次のようなエラーが繰り返して出力され続ける。

unexpected error error_class=Errno::ENOENT error="No such file or directory @ rb_sysopen - ディレクトリ名 "
回復方法

テキスト形式のログファイルの監視定義ファイル(fluentd_@@trapname@@_tail.conf)の,[Input Settings]セクション内のpos_fileパラメーターについて,書式と設定内容が誤ってないかを確認してください。

(10) Script exporterが存在しないスクリプトを実行した

現象

script_successメトリックが0として収集される。また,script_exit_codeメトリックが-1として収集される。

回復方法

定義を修正してScript exporterをリロードまたは再起動してください。

(11) PromitorのScraperのResource Discoveryに不正なホストやポートを指定した

現象

リソースディスカバリーから取得するメトリックが取得されない。

回復方法

定義を修正してPromitorのScraperをリロードまたは再起動してください。