2.19.2 JP1/IM - Agentの設定
- 〈この項の構成〉
-
(1) 共通の設定方法
(a) 設定ファイルを編集する(Linuxの場合)
「1.21.2(1)(a)設定ファイルを編集する(Windowsの場合)」を参照してください。
(b) ユニット定義ファイルを変更する(Linuxの場合だけ)
ユニット定義ファイルの格納先とファイル名を,次に示します。
-
格納先:/usr/lib/systemd/system/
-
ファイル名:jpc_サービス名.service
ユニット定義ファイルを変更する手順を,次に示します。
-
統合エージェントホストにログインする。
-
JP1/IM - Agentのサービスを停止する。
-
ユニット定義ファイルを編集する。
-
次のコマンドを実行し,ユニット定義を反映する。
# systemctl daemon-reload
-
JP1/IM - Agentのサービスを起動する。
(c) コマンドラインオプションを変更する(Linuxの場合)
ユニット定義ファイルのExecStart行で,コマンドラインオプションを変更します。
編集方法については,「2.19.2(1)(b)ユニット定義ファイルを変更する(Linuxの場合だけ)」を参照してください。
(2) 統合エージェント制御基盤の設定
(a) 接続先の統合マネージャーを変更する(Linuxの場合)(オプション)
「1.21.2(2)(a)接続先の統合マネージャーを変更する(Windowsの場合)(オプション)」を参照してください。
(b) ポートを変更する(Linuxの場合)(オプション)
「1.21.2(2)(b)ポートを変更する(Windowsの場合)(オプション)」を参照してください。
(c) CA証明書を配置する(Linuxの場合)(オプション)
「1.21.2(2)(c)CA証明書を配置する(Windowsの場合)(オプション)」を参照してください。
(d) アクション実行に関する設定を変更する(Linuxの場合)(オプション)
「1.21.2(2)(d)アクション実行に関する設定を変更する(Windowsの場合)(オプション)」を参照してください。
(e) プロキシ認証の認証IDとパスワードを設定する(Linuxの場合)(オプション)
「1.21.2(2)(e)プロキシ認証の認証IDとパスワードを設定する(Windowsの場合)(オプション)」を参照してください。
(f) アクションの実行ユーザーを変更する(Linuxの場合)(必須)
imagent設定ファイル(jpc_imagent.json)のaction.usernameを変更します。
設定方法については,「2.19.2(1)(a) 設定ファイルを編集する(Linuxの場合)」を参照してください。
(g) イベント転送中継機能を設定する(Linuxの場合)(オプション)
「1.21.2(2)(g)イベント転送中継機能を設定する(Windowsの場合)(オプション)」を参照してください。
(3) Prometheus serverの設定
(a) ポートを変更する(Linuxの場合)(オプション)
Prometheus serverが使用するリッスンポートは,prometheusコマンドの--web.listen-addressオプションに指定します。
prometheusコマンドのオプションの変更方法については,「2.19.2(1)(c)コマンドラインオプションを変更する(Linuxの場合)」を参照してください。また,--web.listen-addressオプションの詳細については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「ユニット定義ファイル(jpc_プログラム名.service)」(2. 定義ファイル)の「コマンドラインのオプションを変更したい場合」を参照してください。
なお,デフォルトのポートは「20713」です。ポート番号を変更した場合は,ファイアウォールの設定を見直して,外部からのアクセスを禁止してください。ただし,他ホストのBlackbox exporterによる外形監視でPrometheus serverを監視する場合は,アクセスを許可します。この場合,必要に応じて送信元IPアドレスを制限するなどセキュリティ対策を検討してください。
(b) アラート定義を追加する(Linuxの場合)(オプション)
「1.21.2(3)(b)アラート定義を追加する(Windowsの場合)(オプション)」を参照してください。
(c) Blackbox exporterのスクレイプジョブを追加する(Linuxの場合)(オプション)
「1.21.2(3)(c)Blackbox exporterのスクレイプジョブを追加する(Windowsの場合)(オプション)」を参照してください。
(d) ユーザー独自のExporterのスクレイプジョブを追加する(Linuxの場合)(オプション)
「1.21.2(3)(d)ユーザー独自のExporterのスクレイプジョブを追加する(Windowsの場合)(オプション)」を参照してください。
(e) リモートライト先を変更する(Linuxの場合)(オプション)
「1.21.2(3)(e)リモートライト先を変更する(Windowsの場合)(オプション)」を参照してください。
(f) サービス監視の設定をする(Linuxの場合)(オプション)
JP1/IM - Agent 13-00から13-01以降にバージョンアップインストールした環境で,サービス監視機能を使用する場合,次の設定を行います。JP1/IM - Agent 13-01以降を新規インストールした場合は,この設定は不要です。
■ Prometheus設定ファイル(jpc_prometheus_server.yml)の編集
jpc_nodeスクレイプジョブのmetric_relabel_configsの設定で,メトリックを保持する設定に「node_systemd_unit_state」が設定されていない場合,設定を追加します。また,同じmetric_relabel_configsの設定で,「node_systemd_unit_state」メトリックに対するrelabel configが設定されていない場合,設定を追加します。下記のとおりに下線部分の設定を追加します。
(省略) scrape_configs: (省略) - job_name: 'jpc_node' (省略) metric_relabel_configs: - source_labels: ['__name__'] regex: 'node_network_receive_bytes_total|node_network_transmit_bytes_total|〜省略〜|node_vmstat_pswpin|node_vmstat_pswpout|node_systemd_unit_state' action: 'keep' - source_labels: ['__name__'] regex: 'node_systemd_unit_.*' target_label: 'jp1_pc_trendname' replacement: 'node_exporter_service' - source_labels: ['__name__'] regex: 'node_systemd_unit_.*' target_label: 'jp1_pc_category' replacement: 'service' - source_labels: ['__name__','name'] regex: 'node_systemd_unit_.*;(.*)' target_label: 'jp1_pc_nodelabel' replacement: ${1} - regex: jp1_pc_multiple_node action: labeldrop
■ Node exporterのディスカバリ設定ファイル(jpc_file_sd_config_node.yml)の編集
jp1_pc_multiple_nodeが設定されていない場合,下記のとおりに下線部分の設定を追加します。
- targets: - ホスト名:20716 labels: jp1_pc_exporter: JPC Node exporter jp1_pc_category: platform jp1_pc_trendname: node_exporter jp1_pc_multiple_node: "{__name__=~'node_systemd_unit_.*'}"
(g) IM管理ノードのラベル名(jp1_pc_nodelabelの値)が上限を超える場合の設定をする(Linuxの場合)(オプション)
「1.21.2(3)(g)IM管理ノードのラベル名(jp1_pc_nodelabelの値)が上限を超える場合の設定をする(Windowsの場合)(オプション)」を参照してください。
(h) SAPシステムのログ抽出コマンドをScript exporterを使用して実行する場合の設定(Linuxの場合)(オプション)
「1.21.2(3)(h)SAPシステムのログ抽出コマンドをScript exporterを使用して実行する場合の設定(Windowsの場合)(オプション)」を参照してください。
(i) VMware exporterのスクレイプジョブを追加する(Linuxの場合)(オプション)
「1.21.2(3)(j)VMware exporterのスクレイプジョブを追加する(Windowsの場合)(オプション)」を参照してください。
(4) Alertmanagerの設定
(a) ポートを変更する(Linuxの場合)(オプション)
Alertmanagerが使用するリッスンポートは,alertmanagerコマンドの--web.listen-addressオプションに指定します。
alertmanagerコマンドのオプションの変更方法については,「2.19.2(1)(c)コマンドラインオプションを変更する(Linuxの場合)」を参照してください。また,--web.listen-addressオプションの詳細については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「ユニット定義ファイル(jpc_プログラム名.service)」(2. 定義ファイル)の「コマンドラインのオプションを変更したい場合」を参照してください。
なお,デフォルトのポートは「20714」です。ポート番号を変更した場合は,ファイアウォールの設定を見直して,外部からのアクセスを禁止してください。ただし,他ホストのBlackbox exporterによる外形監視でAlertmanagerを監視する場合は,アクセスを許可します。この場合,必要に応じて送信元IPアドレスを制限するなどセキュリティ対策を検討してください。
(b) アラート通知先を変更する(Linuxの場合)(オプション)
「1.21.2(4)(b)アラート通知先を変更する(Windowsの場合)(オプション)」を参照してください。
(c) サイレンスを設定する(Linuxの場合)(オプション)
「1.21.2(4)(c)サイレンスを設定する(Windowsの場合)(オプション)」を参照してください。
(5) Node exporterの設定
(a) ポートを変更する(オプション)
Node exporterが使用するリッスンポートは,node_exporterコマンドの--web.listen-addressオプションに指定します。
node_exporterコマンドのオプションの変更方法については,「2.19.2(1)(c)コマンドラインオプションを変更する(Linuxの場合)」を参照してください。また,--web.listen-addressオプションの詳細については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「ユニット定義ファイル(jpc_プログラム名.service)」(2. 定義ファイル)の「コマンドラインのオプションを変更したい場合」を参照してください。
なお,デフォルトのポートは「20716」です。ポート番号を変更した場合は,ファイアウォールの設定を見直して,外部からのアクセスを禁止してください。
(b) 収集するメトリックを変更する(オプション)
-
Prometheus設定ファイルにメトリックを追加する。
Prometheus設定ファイル(jpc_prometheus_server.yml)のmetric_relabel_configsに,収集するメトリックが「|」で区切って定義されています。収集する必要がないメトリックを削除し,収集するメトリックを追加します。
設定ファイルを更新する手順については,「1.21.2(1)(a)設定ファイルを編集する(Windowsの場合)」を参照してください。
<設定例>
- job_name: 'jpc_node' : metric_relabel_configs: - source_labels: ['__name__'] regex: 'node_boot_time_seconds|node_context_switches_total|node_cpu_seconds_total|node_disk_io_now|node_disk_io_time_seconds_total|node_disk_read_bytes_total|node_disk_reads_completed_total|・・・・・・・|node_time_seconds|node_uname_info|node_vmstat_pswpin|node_vmstat_pswpout【ここにメトリクスを追加します】' action: 'keep'
-
必要に応じて,メトリック定義ファイルにトレンド表示の定義を行う。
Node exporterのメトリック定義ファイルに,トレンド表示の定義を行います。
記述内容については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「Node exporterのメトリック定義ファイル(metrics_node_exporter.conf)」(2. 定義ファイル)を参照してください。
-
サービス監視の設定を行う。
■Node exporterのユニット定義ファイル(jpc_node_exporter.service)の編集
サービス監視を行う場合,下記の下線部分のとおりに,Node exporterのユニット定義ファイル(jpc_node_exporter.service)の編集を行います。
[Unit] Description = JP1/IM3-Agent Linux metric collector After=local-fs.target remote-fs.target rsyslog.service network.target [Service] WorkingDirectory = @@installdir2@@/jp1ima/bin ExecStart = /bin/sh -c '"@@installdir1@@/jp1ima/bin/node_exporter" \ --collector.cpu.info \ (省略) --no-collector.supervisord \ --collector.systemd \ --collector.systemd.unit-include="ユニットファイル名にマッチする正規表現" \ --no-collector.tcpstat \ --no-collector.textfile \ --no-collector.thermal_zone \ (省略)
ExecStart行に設定する引数の値として,「--no-collector.systemd」が設定されている場合,「--collector.systemd」に変更します。「--collector.systemd.unit-include」が設定されていない場合は,行を追加し,値には監視したいユニットのユニットファイル名にマッチする正規表現を設定します。
正規表現の指定の仕方によって,性能情報の収集に時間がかかることがあります。詳細については,マニュアル「JP1/Integrated Management 3 - Manager 導入・設計ガイド」の「付録G.4 正規表現を使用する際のヒント」を参照してください。
■Node exporterのユニット定義ファイル(jpc_node_exporter.service)の定義例
jpc_imagent.serviceとjpc_imagentproxy.serviceのユニットを監視する場合の定義例を,次に示します。
[Unit] Description = JP1/IM3-Agent Linux metric collector After=local-fs.target remote-fs.target rsyslog.service network.target [Service] WorkingDirectory = @@installdir2@@/jp1ima/bin ExecStart = /bin/sh -c '"@@installdir1@@/jp1ima/bin/node_exporter" \ --collector.cpu.info \ (省略) --no-collector.supervisord \ --collector.systemd \ --collector.systemd.unit-include="^(jpc_imagent|jpc_imagentproxy)\.service$" \ --no-collector.tcpstat \ --no-collector.textfile \ --no-collector.thermal_zone \ (省略)
上記の指定に該当するユニットのうち,自動起動が有効,または,状態が実行中であるユニットが監視対象となります。詳細については,マニュアル「JP1/Integrated Management 3 - Manager 導入・設計ガイド」の「3.15.1(1)(d)Node exporter(Linux性能情報収集機能)」の「監視対象サービスの指定」を参照してください。
(6) Process exporterの設定
(a) 監視対象プロセスの指定(必須)
- ■Process exporter設定ファイル(jpc_process_exporter.yml)の編集
-
Process exporter設定ファイル(jpc_process_exporter.yml)を編集し,監視対象プロセスを定義します。
デフォルトでは,コメントアウトによりすべてのプロセスが監視対象外となるため,初期設定のコメントアウトを解除した上で,監視したいプロセスを指定します。
Process exporter設定ファイルの詳細については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「Process exporter設定ファイル(jpc_process_exporter.yml)」(2. 定義ファイル)を参照してください。
(b) 監視メトリックの変更(オプション)
- ■Prometheus設定ファイル(jpc_prometheus_server.yml)の編集
-
収集対象のメトリクスを変更する場合は,Prometheus設定ファイル(jpc_prometheus_server.yml)のmetric_relabel_configsの設定を変更します。
Prometheus設定ファイルの詳細については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「Prometheus設定ファイル(jpc_prometheus_server.yml)」(2. 定義ファイル)を参照してください。
- ■Process exporterのメトリック定義ファイル(metrics_process_exporter.conf)の編集
-
統合オペレーション・ビューアーの[トレンド]タブに表示するメトリックを変更する場合は,Process exporterのメトリック定義ファイル(metrics_process_exporter.conf)の設定を変更します。
Process exporterのメトリック定義ファイルについては,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「Process exporterのメトリック定義ファイル(metrics_process_exporter.conf)」(2. 定義ファイル)を参照してください。
(c) ポートを変更する(オプション)
Process exporterが使用するリッスンポートは,process_exporterコマンドの--web.listen-addressオプションに指定します。
process_exporterコマンドのオプションの変更方法については,「2.19.2(1)(c)コマンドラインオプションを変更する(Linuxの場合)」を参照してください。また,--web.listen-addressオプションの詳細については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「ユニット定義ファイル(jpc_プログラム名.service)」(2. 定義ファイル)の「コマンドラインのオプションを変更したい場合」を参照してください。
なお,デフォルトのポートは「20721」です。ポート番号を変更した場合は,ファイアウォールの設定を見直して,外部からのアクセスを禁止してください。
- 注意事項
-
-
このオプションにホスト名を指定する場合,同じホスト上のProcess exporterのディスカバリ設定ファイル(jpc_file_sd_config_process.yml)のtargetsに,同じホスト名を設定する必要があります。
-
このオプションにIPアドレスを指定する場合,同じホスト上のProcess exporterのディスカバリ設定ファイル(jpc_file_sd_config_process.yml)のtargetsに,オプションで指定したIPアドレスに解決されるホスト名を設定する必要があります。
-
(7) Blackbox exporterの設定
(a) ポートを変更する(Linuxの場合)(オプション)
Blackbox exporterが使用するリッスンポートは,blackbox_exporterコマンドの--web.listen-addressオプションに指定します。
blackbox_exporterコマンドのオプションの変更方法については,「2.19.2(1)(c)コマンドラインオプションを変更する(Linuxの場合)」を参照してください。また,--web.listen-addressオプションの詳細については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「ユニット定義ファイル(jpc_プログラム名.service)」(2. 定義ファイル)の「コマンドラインのオプションを変更したい場合」を参照してください。
なお,デフォルトのポートは「20715」です。ポート番号を変更した場合は,ファイアウォールの設定を見直して,外部からのアクセスを禁止してください。
(b) モジュールを追加・変更・削除する(Linuxの場合)(オプション)
「1.21.2(6)(b)モジュールを追加・変更・削除する(Windowsの場合)(オプション)」を参照してください。
(c) 監視対象を追加・変更・削除する(Linuxの場合)(必須)
「1.21.2(6)(c)監視対象を追加・変更・削除する(Windowsの場合)(必須)」を参照してください。
(d) プロキシ経由でHTTP監視をする(Linuxの場合)(オプション)
「1.21.2(6)(d)プロキシ経由でHTTP監視をする(Windowsの場合)(オプション)」を参照してください。
(e) プロキシ認証の認証IDとパスワードを設定する(Linuxの場合)(オプション)
「1.21.2(6)(e)プロキシ認証の認証IDとパスワードを設定する(Windowsの場合)(オプション)」を参照してください。
(f) 監視対象のWebサーバにアクセスするための認証ID,パスワード,Bearerトークンを設定する(Linuxの場合)(オプション)
「1.21.2(6)(f)監視対象のWebサーバにアクセスするための認証ID,パスワード,Bearerトークンを設定する(Windowsの場合)(オプション)」を参照してください。
(8) Yet another cloudwatch exporterの設定
(a) ポートを変更する(Linuxの場合)(オプション)
「1.21.2(7)(a)ポートを変更する(Windowsの場合)(オプション)」を参照してください。
(b) CloudWatchに接続するための設定を変更する(Linuxの場合)(オプション)
「1.21.2(7)(b)CloudWatchに接続するための設定を変更する(Windowsの場合)(オプション)」を参照してください。
(c) CloudWatchにプロキシ経由で接続する(Linuxの場合)(オプション)
「1.21.2(7)(c)CloudWatchにプロキシ経由で接続する(Windowsの場合)(オプション)」を参照してください。
(d) 監視するAWSサービスを追加する(オプション)
「1.21.2(7)(d)監視するAWSサービスを追加する(オプション)」を参照してください。
(e) AWSリソースを監視対象にする(オプション)
「1.21.2(7)(e)AWSリソースを監視対象にする(オプション)」を参照してください。
(f) 収集するメトリックを変更する(オプション)
「1.21.2(7)(f)収集するメトリックを変更する(オプション)」を参照してください。
(9) Promitorの設定
「1.21.2(8)Promitorの設定」を参照してください。
(10) Fluentdの設定
(a) ログ監視の共通定義の設定を変更する(オプション)
「1.21.2(9)(a)ログ監視の共通定義の設定を変更する(Windowsの場合)(オプション)」を参照してください。
(b) テキスト形式のログファイルを監視する(必須)
「1.21.2(9)(b)テキスト形式のログファイルを監視する(Windowsの場合)(必須)」を参照してください。
(c) テキスト形式のログファイルの監視設定を変更する(オプション)
「1.21.2(9)(c)テキスト形式のログファイルの監視設定を変更する(Windowsの場合)(オプション)」を参照してください。
(d) テキスト形式のログファイルの監視設定を削除する(オプション)
「1.21.2(9)(d)テキスト形式のログファイルの監視設定を削除する(Windowsの場合)(オプション)」を参照してください。
(e) ログメトリクス定義の設定(必須)
「1.21.2(9)(h)ログメトリクス定義の設定(必須)」を参照してください。
(f) ポートを変更する(オプション)
「1.21.2(9)(i)ポートを変更する(オプション)」を参照してください。
(g) SAPシステムのログ情報を監視する(オプション)
「1.21.2(9)(j)SAPシステムのログ情報を監視する(オプション)」を参照してください。
(h) SAPシステムのログ情報の監視設定を変更する(オプション)
「1.21.2(9)(k)SAPシステムのログ情報の監視設定を変更する(オプション)」を参照してください。
(i) SAPシステムのログ情報の監視設定を削除する(オプション)
「1.21.2(9)(l)SAPシステムのログ情報の監視設定を削除する(オプション)」を参照してください。
(j) SAPシステムのCCMSアラート情報を監視する(オプション)
「1.21.2(9)(m)SAPシステムのCCMSアラート情報を監視する(オプション)」を参照してください。
(k) SAPシステムのCCMSアラート情報の監視設定を変更する(オプション)
「1.21.2(9)(n)SAPシステムのCCMSアラート情報の監視設定を変更する(オプション)」を参照してください。
(l) SAPシステムのCCMSアラート情報の監視設定を削除する(オプション)
「1.21.2(9)(o)SAPシステムのCCMSアラート情報の監視設定を削除する(オプション)」を参照してください。
(11) スクレイプ定義の設定
「1.21.2(10)スクレイプ定義の設定」を参照してください。
(12) コンテナ監視の設定
「1.21.2(11)コンテナ監視の設定」を参照してください。
(13) Script exporterの定義ファイルの編集
「1.21.2(12)Script exporterの定義ファイルの編集」を参照してください。
(14) VMware exporterの設定
「1.21.2(14)VMware exporterの設定」を参照してください。
(15) リッスンポート番号とリッスンアドレスの設定(オプション)
「1.21.2(15)リッスンポート番号とリッスンアドレスの設定(オプション)」を参照してください。
(16) ファイアウォールの設定(Linuxの場合)(必須)
「1.21.2(16)ファイアウォールの設定(Windowsの場合)(必須)」を参照してください。
(17) 統合エージェントのプロセスの死活監視の設定(Linuxの場合)(オプション)
統合エージェントのプロセスは,次の種類の方法で監視します。
-
他ホストのBlackbox exporterによる外形監視
-
Process exporterによるプロセスの死活監視
-
Prometheus serverのupメトリックによる監視
(a) 他ホストのBlackbox exporterによる外形監視
Prometheus serverサービスとAlertmanagerサービスは,他ホスト上で稼働している統合エージェントのBlackbox exporterから監視します。監視するURLは,次の表のとおりです。
Blackbox exporterのHTTP監視を追加する方法については,「1.21.2(6)(c)監視対象を追加・変更・削除する(Windowsの場合)(必須)」を参照してください。アラート定義の設定方法については,「1.21.2(3)(b)アラート定義を追加する(Windowsの場合)(オプション)」を参照してください。
Blackbox exporterのHTTP監視で監視するアラート定義の例については,「1.21.2(17)統合エージェントのプロセスの死活監視の設定(Windowsの場合)(オプション)」を参照してください。
サービス |
監視するURL |
---|---|
Prometheus server |
http://統合エージェントのホスト名:Prometheus serverのポート番号/-/healthy |
Alertmanager |
http://統合エージェントのホスト名:Alertmanagerのポート番号/-/healthy |
(b) Process exporterによるプロセスの死活監視
imagentproxyサービス,imagentactionサービス,Fluentdサービスは,Process exporterのプロセス監視の稼動情報で監視します。監視するプロセスは次の表に記載されています。
設定方法の詳細については,マニュアル「JP1/Integrated Management 3 - Manager コマンド・定義ファイル・APIリファレンス」の「Process exporter設定ファイル(jpc_process_exporter.yml)」(2. 定義ファイル)を参照してください。
アラート定義の設定方法については,「1.21.2(3)(b)アラート定義を追加する(Windowsの場合)(オプション)」を参照してください。
サービス |
監視するプロセス |
備考 |
---|---|---|
imagent |
Agentパス/bin/imagent |
マニュアル「JP1/Integrated Management 3 - Manager 導入・設計ガイド」の「3.15.8(2)統合エージェント制御基盤のポーリング監視」の注意事項に記載しているimagentが異常停止してから短時間で起動するケースを検知したい場合に設定します。 |
imagentproxy |
Agentパス/bin/imagentproxy |
該当なし。 |
imagentaction |
Agentパス/bin/imagentaction |
該当なし。 |
Fluentd |
Agentパス/lib/ruby/bin/ruby |
コマンドラインに「jpc_fluentd_common.conf」の文字列があるため,Fluentd以外のrubyと区別できます。 |
rotatelogs(Fluentdの場合だけ) |
Agentパス/bin/rotatelogs |
コマンドラインに「Agentパス/logs/fluentd」の文字列があるため,Fluentd以外のrotatelogsと区別できます。 |
Process exporterで監視するProcess exporter設定ファイルの例を,次に示します。
process_names: - name: "{{.ExeBase}};{{.Username}};{{.Matches.cmdline}}" exe: - /opt/jp1ima/bin/imagent - /opt/jp1ima/bin/imagentproxy - /opt/jp1ima/bin/imagentaction - name: "{{.ExeBase}};{{.Username}};{{.Matches.cmdline}}" exe: - /opt/jp1ima/bin/rotatelogs cmdline: - (?P<cmdline>.*/opt/jp1ima/logs/fluentd\.*) - name: "{{.ExeBase}};{{.Username}};{{.Matches.cmdline}}" exe: - /opt/jp1ima/lib/ruby/bin/ruby cmdline: - (?P<cmdline>.*jpc_fluentd_common\.conf.*)
Process exporterで監視するアラート定義の例を,次に示します。
groups: - name: process_exporter rules: - alert: jp1_pc_procmon_imagent expr: 1 > sum by (program, instance, job, jp1_pc_nodelabel, jp1_pc_exporter) (namedprocess_namegroup_num_procs{program="imagent"}) for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "1303" jp1_pc_metricname: "namedprocess_namegroup_num_procs" annotations: jp1_pc_firing_description: "プロセス数がしきい値(1個)を下回りました。value={{ $value }}" jp1_pc_resolved_description: "プロセス数がしきい値(1個)を上回りました。" - alert: jp1_pc_procmon_imagentproxy expr: 1 > sum by (program, instance, job, jp1_pc_nodelabel, jp1_pc_exporter) (namedprocess_namegroup_num_procs{program="imagentproxy"}) for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "1303" jp1_pc_metricname: "namedprocess_namegroup_num_procs" annotations: jp1_pc_firing_description: "プロセス数がしきい値(1個)を下回りました。value={{ $value }}" jp1_pc_resolved_description: "プロセス数がしきい値(1個)を上回りました。" - alert: jp1_pc_procmon_imagentactoin expr: 1 > sum by (program, instance, job, jp1_pc_nodelabel, jp1_pc_exporter) (namedprocess_namegroup_num_procs{program="imagentaction"}) for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "1303" jp1_pc_metricname: "namedprocess_namegroup_num_procs" annotations: jp1_pc_firing_description: "プロセス数がしきい値(1個)を下回りました。value={{ $value }}" jp1_pc_resolved_description: "プロセス数がしきい値(1個)を上回りました。" - alert: jp1_pc_procmon_fluentd_rotatelogs Log trapper(Fluentd) ※1 expr: 1 > sum by (program, instance, job, jp1_pc_nodelabel, jp1_pc_exporter) (namedprocess_namegroup_num_procs{program="rotatelogs"}) for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "1303" jp1_pc_metricname: "namedprocess_namegroup_num_procs" annotations: jp1_pc_firing_description: "プロセス数がしきい値(1個)を下回りました。value={{ $value }}" jp1_pc_resolved_description: "プロセス数がしきい値(1個)を上回りました。" - alert: jp1_pc_procmon_fluentd_ruby Log trapper(Fluentd) ※2 expr: 2 > sum by (program, instance, job, jp1_pc_nodelabel, jp1_pc_exporter) (namedprocess_namegroup_num_procs{program="ruby"}) ※3 for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "1303" jp1_pc_metricname: "namedprocess_namegroup_num_procs" annotations: jp1_pc_firing_description: "プロセス数がしきい値(2個)を下回りました。value={{ $value }}" jp1_pc_resolved_description: "プロセス数がしきい値(2個)を上回りました。"
- 注※1
-
ログメトリクス機能のみ使う場合,「jp1_pc_procmon_fluentd_prome_rotatelogs Log trapper(Fluentd)」を指定します。
- 注※2
-
ログメトリクス機能のみ使う場合,「jp1_pc_procmon_fluentd_prome_ruby Log trapper(Fluentd)」を指定します。
- 注※3
-
rubyのプロセスはworkerの数+1起動します。しきい値はworkerの数+1を指定してください。workerの数については,マニュアル「JP1/Integrated Management 3 -
Manager コマンド・定義ファイル・API リファレンス」の「ログ監視共通定義ファイル(jpc_fluentd_common.conf)」(2. 定義ファイル)を参照してください。
(c) Prometheus serverのupメトリックによる監視
Node exporterサービス,Process exporterサービス,Blackbox exporterサービス,Yet another cloudwatch exporterサービスは,Prometheus serverのアラート監視で監視します。アラート定義の設定方法については,「1.21.2(3)(b)アラート定義を追加する(Windowsの場合)(オプション)」を参照してください。
upメトリックを監視するアラート定義の例については,「1.21.2(17)統合エージェントのプロセスの死活監視の設定(Windowsの場合)(オプション)」を参照してください。
(18) IM管理ノードのツリー情報の作成と反映(Linuxの場合)(必須)
「1.21.2(18) IM管理ノードのツリー情報の作成と反映(Windowsの場合)(必須)」を参照してください。
(19) セキュリティ製品の除外設定(Linuxの場合)(オプション)
「1.21.2(19)セキュリティ製品の除外設定(Windowsの場合)(オプション)」を参照してください。
(20) 定義ファイル更新時の注意事項(Linuxの場合)
「1.21.2(20)定義ファイル更新時の注意事項(Windowsの場合)」を参照してください。