Yet another cloudwatch exporterのメトリック定義ファイル(metrics_ya_cloudwatch_exporter.conf)
形式
[
{
"name":"トレンドデータのメトリック名",
"default":デフォルト選択状態,
"promql":"PromQL文",
"resource_en":{
"category":"メトリックのカテゴリ(英語)",
"label":"メトリック表示名(英語)",
"description":"メトリックの説明(英語)",
"unit":"メトリックの単位(英語)"
},
"resource_ja":{
"category":"メトリックのカテゴリ(日本語)",
"label":"メトリック表示名(日本語)",
"description":"メトリックの説明(日本語)",
"unit":"メトリックの単位(日本語)"
},
"cloud_srv": "AWSサービス名前空間名",
"drop_legend_labels": ["ラベル名", ・・・]
}, ・・・
]※- 注※
-
[]内に記述できる要素の数は1〜1,000個です。範囲外の個数の要素を記述した場合は,KAJY24609-Eのエラーメッセージを出力します。
ファイル
metrics_ya_cloudwatch_exporter.conf
metrics_ya_cloudwatch_exporter.conf.model(モデルファイル)
格納先ディレクトリ
■統合マネージャーホスト
- Windowsの場合
-
-
物理ホストのとき
Managerパス\conf\imdd\plugin\jp1pccs\
-
論理ホストのとき
共有フォルダ\jp1imm\conf\imdd\plugin\jp1pccs\
-
- Linuxの場合
-
-
物理ホストのとき
/etc/opt/jp1imm/conf/imdd/plugin/jp1pccs/
-
論理ホストのとき
共有ディレクトリ/jp1imm/conf/imdd/plugin/jp1pccs/
-
説明
[統合オペレーション・ビューアー]画面の[トレンド]タブで表示するYet another cloudwatch exporterのメトリック情報を定義するファイルです。
定義内容は,JP1/IM - Agentの製品プラグインの__metricListGetメソッド,および__timeSeriesDataGetメソッドの返却値に使用します。
Yet another cloudwatch exporterのIM管理ノードは,Yet another cloudwatch exporterのメトリック定義ファイルに定義されているメトリックのリソースだけに作成します。
JP1/IM - Managerが階層構成で,統合マネージャーから,下位マネージャーのトレンドデータ管理DBに保存されているトレンドデータを参照する場合,統合マネージャーのメトリック定義ファイルに,参照するトレンドデータのメトリックを追加する必要があります。
文字コード
UTF-8(BOM無し)
改行コード
Windowsの場合:CR+LF
Linuxの場合:LF
定義の反映時期
[統合オペレーション・ビューアー]画面の[トレンド]タブ,または,REST APIで,メトリックの情報を取得したときに反映されます。
Yet another cloudwatch exporterのIM管理ノードについては,jddcreatetreeコマンドおよびjddupdatetreeコマンドを実行したときに反映されます。
記述内容
nameメンバーとcloud_srvメンバーに設定する値を次に示します。それ以外のメンバーに設定する値については,「Node exporterのメトリック定義ファイル(metrics_node_exporter.conf)」の「記述内容」を参照してください。
|
メンバー名 |
省略可否 |
型 |
設定する値 |
|---|---|---|---|
|
name |
不可 |
string |
トレンドデータのメトリック名を設定します。 トレンドデータ(時系列データ)のメトリック名は,[統合オペレーション・ビューアー]画面の[トレンド]タブで,トレンドデータの種類を示す文字列として表示されます。 Yet another cloudwatch exporterのメトリック定義ファイルの場合,ここで定義されているメトリックのリソースだけを作成します。また,メトリック名は,Yet another cloudwatch exporterのメトリック名と一致させる必要があります。 1〜255文字で,次に示す文字を指定できます。
指定不可の文字を含む場合,KAJY24604-EまたはKAJY24605-Eのエラーメッセージが出力されます。 メトリック名は,メトリック定義ファイル内で一意にしてください。一意でない場合,KAJY24608-Eのエラーメッセージが出力されます。 |
|
cloud_srv |
可 |
string |
AWSサービス名前空間名を設定します。 このメンバーは,Yet another cloudwatch exporterのメトリック定義ファイルの場合だけ,必須で設定します。 Yet another cloudwatch exporter設定ファイル(jpc_ya_cloudwatch_exporter.yml)で指定した次の名前空間の名称を設定します。
(例1)AWS/EC2 (例2)AWS/S3 1〜255文字で,次に示す文字を指定できます。
指定不可の文字を含む場合,KAJY24604-EまたはKAJY24605-Eのエラーメッセージが出力されます。 |
- 注※
-
Auto-discovery jobのtypeに指定できる名前空間(サービス)については,マニュアル「JP1/Integrated Management 3 - Manager 導入・設計ガイド」の「9.5.1(1)(k) Yet another cloudwatch exporterのIM管理ノードの作成」の,JP1/IM - AgentのYet another cloudwatch exporterが監視対象としてサポートするAWSの名前空間について説明している個所を参照してください。
モデルファイルの設定内容(初期状態)とアラート定義例
Yet another cloudwatch exporterのメトリック定義ファイルのモデルファイルに記述されている各メトリックの設定内容(初期状態)とアラート定義例(アラート設定ファイル)を,次に示します。
-
aws_ec2_cpuutilization_average
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_ec2_cpuutilization_average
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_ec2_cpuutilization_average and $jp1im_TrendData_labels
resource_en
category
aws_ec2
label
CPU utilization
description
The percentage of the allocated EC2 compute units that are currently in use on the instance. For details, see the description of the CPUUtilization metric for AWS/EC2.
unit
%
resource_ja
category
aws_ec2
label
CPU使用率
description
割り当てられた EC2 コンピュートユニットのうち,現在インスタンス上で使用されているものの比率。
詳細はAWS/EC2のCPUUtilizationメトリックの説明を参照してください。
unit
%
cloud_srv
AWS/EC2
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_ec2_cpuutilization_average(Yet another cloudwatch exporter) expr: 80 < aws_ec2_cpuutilization_average for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0601" jp1_pc_metricname: "aws_ec2_cpuutilization_average" annotations: jp1_pc_firing_description: "CPU使用率がしきい値(80%)を上回りました。value={{ $value }}%" jp1_pc_resolved_description: "CPU使用率がしきい値(80%)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_ec2_disk_read_bytes_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_ec2_disk_read_bytes_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
(aws_ec2_disk_read_bytes_sum and $jp1im_TrendData_labels) / 1024
resource_en
category
aws_ec2
label
Amount of data read in KB
description
Amount of data in KB read from all instance store volumes available to the instance.
For more information, see the description of the DiskReadBytes metric of AWS EC2.
unit
KB
resource_ja
category
aws_ec2
label
読み取りキロバイト数
description
インスタンスで利用できるすべてのインスタンスストアボリュームから読み取られたキロバイト数。
詳細はAWS/EC2のDiskReadBytesメトリックの説明を参照してください。
unit
キロバイト
cloud_srv
AWS/EC2
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_ec2_disk_read_bytes_sum(Yet another cloudwatch exporter) expr: 10240 < aws_ec2_disk_read_bytes_sum / 1024 for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0602" jp1_pc_metricname: "aws_ec2_disk_read_bytes_sum" annotations: jp1_pc_firing_description: "インスタンスストアボリュームの読み取りキロバイト数がしきい値(10,240KB)を上回りました。value={{ $value }}KB" jp1_pc_resolved_description: "インスタンスストアボリュームの読み取りキロバイト数がしきい値(10,240KB)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_ec2_disk_write_bytes_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_ec2_disk_write_bytes_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
(aws_ec2_disk_write_bytes_sum and $jp1im_TrendData_labels) / 1024
resource_en
category
aws_ec2
label
Amount of data written in KB
description
Amount of data in KB written to all instance store volumes available to the instance.
For more information, see the description of the DiskWriteBytes metric of AWS EC2.
unit
KB
resource_ja
category
aws_ec2
label
書き込みキロバイト数
description
インスタンスで利用できるすべてのインスタンスストアボリュームに書き込まれたキロバイト数。
詳細はAWS/EC2のDiskWriteBytesメトリックの説明を参照してください。
unit
キロバイト
cloud_srv
AWS/EC2
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_ec2_disk_write_bytes_sum(Yet another cloudwatch exporter) expr: 10240 < aws_ec2_disk_write_bytes_sum / 1024 for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0603" jp1_pc_metricname: "aws_ec2_disk_write_bytes_sum" annotations: jp1_pc_firing_description: "インスタンスストアボリュームの書き込みキロバイト数がしきい値(10,240KB)を上回りました。value={{ $value }}KB" jp1_pc_resolved_description: "インスタンスストアボリュームの書き込みキロバイト数がしきい値(10,240KB)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_lambda_errors_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_lambda_errors_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_lambda_errors_sum and $jp1im_TrendData_labels
resource_en
category
aws_lambda
label
Number of invocations
description
The number of invocations that result in a function error. For details, see the description of the Errors metric for AWS/Lambda.
unit
count
resource_ja
category
aws_lambda
label
呼び出し数
description
関数エラーが発生した呼び出しの数。
詳細はAWS/LambdaのErrorsメトリックの説明を参照してください。
unit
個
cloud_srv
AWS/Lambda
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_lambda_errors_sum(Yet another cloudwatch exporter) expr: 0 < aws_lambda_errors_sum{dimension_Resource=""} for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0604" jp1_pc_metricname: "aws_lambda_errors_sum" annotations: jp1_pc_firing_description: "関数エラーが発生した呼び出しの数がしきい値(0個)を上回りました。value={{ $value }}個" jp1_pc_resolved_description: "関数エラーが発生した呼び出しの数がしきい値(0個)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_lambda_duration_average
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_lambda_duration_average
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_lambda_duration_average and $jp1im_TrendData_labels
resource_en
category
aws_lambda
label
Event processing time
description
The amount of time that your function code spends processing an event. For details, see the description of the Duration metric for AWS/Lambda.
unit
msec
resource_ja
category
aws_lambda
label
イベント処理時間
description
関数コードがイベントの処理に費やす時間。
詳細はAWS/LambdaのDurationメトリックの説明を参照してください。
unit
ミリ秒
cloud_srv
AWS/Lambda
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_lambda_duration_average(Yet another cloudwatch exporter) expr: 5000 < aws_lambda_duration_average{dimension_Resource=""} for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0605" jp1_pc_metricname: "aws_lambda_duration_average" annotations: jp1_pc_firing_description: "関数コードがイベントの処理に費やす時間がしきい値(5000ミリ秒)を上回りました。value={{ $value }}ミリ秒" jp1_pc_resolved_description: "関数コードがイベントの処理に費やす時間がしきい値(5000ミリ秒)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_s3_bucket_size_bytes_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_s3_bucket_size_bytes_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
(aws_s3_bucket_size_bytes_sum and $jp1im_TrendData_labels) / (1024*1024*1024)
resource_en
category
aws_s3
label
Amount of data stored
description
The amount of data in GB stored in a bucket in the STANDARD storage class, INTELLIGENT_TIERING storage class, Standard-Infrequent Access (STANDARD_IA) storage class, OneZone-Infrequent Access (ONEZONE_IA), Reduced Redundancy Storage (RRS) class, Deep Archive Storage (S3 Glacier Deep Archive) class or, Glacier (GLACIER) storage class. For details, see the description of the BucketSizeBytes metric for AWS/S3.
unit
GB
resource_ja
category
aws_s3
label
保存データ量
description
STANDARD ストレージクラス,INTELLIGENT_TIERING ストレージクラス,標準低頻度アクセス(STANDARD_IA)ストレージクラス,OneZone 低頻度アクセス(ONEZONE_IA),低冗長化ストレージ (RRS) クラス,ディープアーカイブストレージ(S3 Glacier Deep Archive),または Glacier (GLACIER)ストレージクラスのバケットに保存されているデータの量(ギガバイト単位)。
詳細はAWS/S3のBucketSizeBytesメトリックの説明を参照してください。
unit
ギガバイト
cloud_srv
AWS/S3
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_s3_bucket_size_bytes_sum(Yet another cloudwatch exporter) expr: 1024 < aws_s3_bucket_size_bytes_sum / (1024*1024*1024) for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0606" jp1_pc_metricname: "aws_s3_bucket_size_bytes_sum" annotations: jp1_pc_firing_description: "バケットの保存データ量がしきい値(1024GB)を上回りました。value={{ $value }}GB" jp1_pc_resolved_description: "バケットの保存データ量がしきい値(1024GB)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_s3_5xx_errors_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_s3_5xx_errors_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_s3_5xx_errors_sum and $jp1im_TrendData_labels
resource_en
category
aws_s3
label
Number of 5xx server errors
description
The number of HTTP 5xx server error status code requests made to an Amazon S3 bucket with a value of either 0 or 1. For details, see the description of the 5xx_errors metric for AWS/S3.
unit
count
resource_ja
category
aws_s3
label
5xxサーバエラー数
description
Amazon S3バケットに対して行われた,値が0または1のHTTP 5xxサーバーエラーステータスコードリクエストの数。
詳細はAWS/S3の5xx_errorsメトリックの説明を参照してください。
unit
個
cloud_srv
AWS/S3
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_s3_5xx_errors_sum(Yet another cloudwatch exporter) expr: 0 < aws_s3_5xx_errors_sum for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0607" jp1_pc_metricname: "aws_s3_5xx_errors_sum" annotations: jp1_pc_firing_description: "バケットへのリクエストに対して,HTTP 5xx サーバーエラーステータスコードを返却される数が,しきい値(0個)を上回りました。value={{ $value }}個" jp1_pc_resolved_description: "バケットへのリクエストに対して,HTTP 5xx サーバーエラーステータスコードを返却される数が,しきい値(0個)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_dynamodb_consumed_read_capacity_units_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_dynamodb_consumed_read_capacity_units_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_dynamodb_consumed_read_capacity_units_sum and $jp1im_TrendData_labels
resource_en
category
aws_dynamo_db
label
Number of read capacity units
description
The total number of read capacity units consumed. For details, see the description of the ConsumedReadCapacityUnits metric for Amazon DynamoDB.
unit
count
resource_ja
category
aws_dynamo_db
label
読み込み容量ユニット数
description
消費された読み込み容量ユニットの合計。
詳細はAmazon DynamoDBのConsumedReadCapacityUnitsメトリックの説明を参照してください。
unit
個
cloud_srv
AWS/DynamoDB
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_dynamodb_consumed_read_capacity_units_sum(Yet another cloudwatch exporter) expr: 600 < aws_dynamodb_consumed_read_capacity_units_sum for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0608" jp1_pc_metricname: "aws_dynamodb_consumed_read_capacity_units_sum" annotations: jp1_pc_firing_description: "消費された読み込み容量ユニットの合計数がしきい値(600個)を上回りました。value={{ $value }}個" jp1_pc_resolved_description: "消費された読み込み容量ユニットの合計数がしきい値(600個)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_dynamodb_consumed_write_capacity_units_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_dynamodb_consumed_write_capacity_units_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_dynamodb_consumed_write_capacity_units_sum and $jp1im_TrendData_labels
resource_en
category
aws_dynamo_db
label
Number of write capacity units
description
The total number of write capacity units consumed. For details, see the description of the ConsumedWriteCapacityUnits metric for Amazon DynamoDB.
unit
count
resource_ja
category
aws_dynamo_db
label
書き込み容量ユニット数
description
消費された書き込み容量ユニットの合計。
詳細はAmazon DynamoDBのConsumedWriteCapacityUnitsメトリックの説明を参照してください。
unit
個
cloud_srv
AWS/DynamoDB
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_dynamodb_consumed_write_capacity_units_sum(Yet another cloudwatch exporter) expr: 600 < aws_dynamodb_consumed_write_capacity_units_sum for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0609" jp1_pc_metricname: "aws_dynamodb_consumed_write_capacity_units_sum" annotations: jp1_pc_firing_description: "消費された書き込み容量ユニットの合計数がしきい値(600個)を上回りました。value={{ $value }}個" jp1_pc_resolved_description: "消費された書き込み容量ユニットの合計数がしきい値(600個)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_states_execution_time_average
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_states_execution_time_average
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_states_execution_time_average and $jp1im_TrendData_labels
resource_en
category
aws_states
label
Execution time
description
The average of the interval, in milliseconds, from the start to the end of the execution of Step Functions. For details, see the description of the ExecutionTime metric for AWS Step Functions.
unit
msec
resource_ja
category
aws_states
label
実行時間
description
Step Functionsの実行の開始時点から終了時点までの間隔の平均値(ミリ秒単位)。
詳細はAWS Step FunctionsのExecutionTimeメトリックの説明を参照してください。
unit
ミリ秒
cloud_srv
AWS/States
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_states_execution_time_average(Yet another cloudwatch exporter) expr: 5000 < aws_states_execution_time_average for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0610" jp1_pc_metricname: "aws_states_execution_time_average" annotations: jp1_pc_firing_description: "Step Functionsの実行時間がしきい値(5000ミリ秒)を上回りました。value={{ $value }}ミリ秒" jp1_pc_resolved_description: "Step Functionsの実行時間がしきい値(5000ミリ秒)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_states_executions_failed_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_states_executions_failed_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_states_executions_failed_sum and $jp1im_TrendData_labels
resource_en
category
aws_states
label
Number of failed executions
description
The total number of failed executions of Step Functions. For details, see the description of the ExecutionsFailed metric for AWS Step Functions.
unit
count
resource_ja
category
aws_states
label
実行失敗数
description
Step Functionsの失敗した実行の合計数。
詳細はAWS Step FunctionsのExecutionsFailedメトリックの説明を参照してください。
unit
個
cloud_srv
AWS/States
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_states_executions_failed_sum(Yet another cloudwatch exporter) expr: 0 < aws_states_executions_failed_sum for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0611" jp1_pc_metricname: "aws_states_executions_failed_sum" annotations: jp1_pc_firing_description: "Step Functionsの実行失敗数がしきい値(0個)を上回りました。value={{ $value }}個" jp1_pc_resolved_description: "Step Functionsの実行失敗数がしきい値(0個)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_sqs_approximate_number_of_messages_delayed_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_sqs_approximate_number_of_messages_delayed_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_sqs_approximate_number_of_messages_delayed_sum and $jp1im_TrendData_labels
resource_en
category
aws_sqs
label
Number of messages in the delay queue
description
The total number of messages in the queue that are delayed and not available for reading immediately. For details, see the description of the ApproximateNumberOfMessagesDelayed metric for Amazon SQS.
unit
count
resource_ja
category
aws_sqs
label
遅延キューメッセージ数
description
遅延が発生したため,すぐに読み取ることのできない,キューのメッセージの合計数。
詳細はAmazon SQSのApproximateNumberOfMessagesDelayedメトリックの説明を参照してください。
unit
個
cloud_srv
AWS/SQS
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_sqs_approximate_number_of_messages_delayed_sum(Yet another cloudwatch exporter) expr: 0 < aws_sqs_approximate_number_of_messages_delayed_sum for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0612" jp1_pc_metricname: "aws_sqs_approximate_number_of_messages_delayed_sum" annotations: jp1_pc_firing_description: "遅延キューメッセージ数がしきい値(0個)を上回りました。value={{ $value }}個" jp1_pc_resolved_description: "遅延キューメッセージ数がしきい値(0個)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。
-
aws_sqs_number_of_messages_deleted_sum
■設定内容(初期状態)
メンバー名
設定内容(初期状態)
name
aws_sqs_number_of_messages_deleted_sum
default
false
メトリック定義ファイル用promql($jp1im_TrendData_labelsを含む)
aws_sqs_number_of_messages_deleted_sum and $jp1im_TrendData_labels
resource_en
category
aws_sqs
label
Number of messages in the deletion queue
description
The total number of messages deleted from the queue. For details, see the description of the NumberOfMessagesDeleted metric for Amazon SQS.
unit
count
resource_ja
category
aws_sqs
label
削除キューメッセージ数
description
キューから削除されたメッセージの合計数。
詳細はAmazon SQSのNumberOfMessagesDeletedメトリックの説明を参照してください。
unit
個
cloud_srv
AWS/SQS
■アラート定義例※
groups: - name: yet_another_cloudwatch_exporter rules: - alert: aws_sqs_number_of_messages_deleted_sum(Yet another cloudwatch exporter) expr: 0 < aws_sqs_number_of_messages_deleted_sum for: 3m labels: jp1_pc_product_name: "/HITACHI/JP1/JPCCS2" jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO" jp1_pc_severity: "Error" jp1_pc_eventid: "0613" jp1_pc_metricname: "aws_sqs_number_of_messages_deleted_sum" annotations: jp1_pc_firing_description: "削除キューメッセージ数がしきい値(0個)を上回りました。value={{ $value }}個" jp1_pc_resolved_description: "削除キューメッセージ数がしきい値(0個)を下回りました。"- 注※
-
複数のアラートを同一の監視エージェントホストで定義する場合,「groups:」を重複して指定したり,同じグループ名を指定したnameを重複して指定したりしないように注意してください。