Yet another cloudwatch exporterのメトリック定義ファイル（metrics_ya_cloudwatch_exporter.conf）

〈このページの構成〉

形式
ファイル
格納先ディレクトリ
説明
文字コード
改行コード
定義の反映時期
記述内容
モデルファイルの設定内容（初期状態）とアラート定義例

形式

[
  {
    "name":"トレンドデータのメトリック名",
    "default":デフォルト選択状態,
    "promql":"PromQL文",
    "resource_en":{
      "category":"メトリックのカテゴリ（英語）",
      "label":"メトリック表示名（英語）",
      "description":"メトリックの説明（英語）",
      "unit":"メトリックの単位（英語）"
    },
    "resource_ja":{
      "category":"メトリックのカテゴリ（日本語）",
      "label":"メトリック表示名（日本語）",
      "description":"メトリックの説明（日本語）",
      "unit":"メトリックの単位（日本語）"
    },
    "cloud_srv": "AWSサービス名前空間名",
    "drop_legend_labels": ["ラベル名", ･･･]
  }, ･･･
]^※

注※: []内に記述できる要素の数は1〜1,000個です。範囲外の個数の要素を記述した場合は，KAJY24609-Eのエラーメッセージを出力します。

ページの先頭へ

ファイル

metrics_ya_cloudwatch_exporter.conf

metrics_ya_cloudwatch_exporter.conf.model（モデルファイル）

ページの先頭へ

格納先ディレクトリ

■統合マネージャーホスト

Windowsの場合

物理ホストのとき

Managerパス\conf\imdd\plugin\jp1pccs\
論理ホストのとき

共有フォルダ\jp1imm\conf\imdd\plugin\jp1pccs\

Linuxの場合

物理ホストのとき

/etc/opt/jp1imm/conf/imdd/plugin/jp1pccs/
論理ホストのとき

共有ディレクトリ/jp1imm/conf/imdd/plugin/jp1pccs/

ページの先頭へ

説明

［統合オペレーション・ビューアー］画面の［トレンド］タブで表示するYet another cloudwatch exporterのメトリック情報を定義するファイルです。

定義内容は，JP1/IM - Agentの製品プラグインの__metricListGetメソッド，および__timeSeriesDataGetメソッドの返却値に使用します。

Yet another cloudwatch exporterのIM管理ノードは，Yet another cloudwatch exporterのメトリック定義ファイルに定義されているメトリックのリソースだけに作成します。

JP1/IM - Managerが階層構成で，統合マネージャーから，下位マネージャーのトレンドデータ管理DBに保存されているトレンドデータを参照する場合，統合マネージャーのメトリック定義ファイルに，参照するトレンドデータのメトリックを追加する必要があります。

ページの先頭へ

文字コード

UTF-8（BOM無し）

ページの先頭へ

改行コード

Windowsの場合：CR+LF

Linuxの場合：LF

ページの先頭へ

定義の反映時期

［統合オペレーション・ビューアー］画面の［トレンド］タブ，または，REST APIで，メトリックの情報を取得したときに反映されます。

Yet another cloudwatch exporterのIM管理ノードについては，jddcreatetreeコマンドおよびjddupdatetreeコマンドを実行したときに反映されます。

ページの先頭へ

記述内容

nameメンバーとcloud_srvメンバーに設定する値を次に示します。それ以外のメンバーに設定する値については，「Node exporterのメトリック定義ファイル（metrics_node_exporter.conf）」の「記述内容」を参照してください。

表2‒97　メトリック定義ファイルのnameメンバーとcloud_srvメンバーに設定する値
メンバー名	省略可否	型	設定する値
name	不可	string	トレンドデータのメトリック名を設定します。トレンドデータ（時系列データ）のメトリック名は，［統合オペレーション・ビューアー］画面の［トレンド］タブで，トレンドデータの種類を示す文字列として表示されます。 Yet another cloudwatch exporterのメトリック定義ファイルの場合，ここで定義されているメトリックのリソースだけを作成します。また，メトリック名は，Yet another cloudwatch exporterのメトリック名と一致させる必要があります。 1〜255文字で，次に示す文字を指定できます。半角英数字 `-`（ハイフン） `_`（アンダースコア）指定不可の文字を含む場合，KAJY24604-EまたはKAJY24605-Eのエラーメッセージが出力されます。メトリック名は，メトリック定義ファイル内で一意にしてください。一意でない場合，KAJY24608-Eのエラーメッセージが出力されます。
cloud_srv	可	string	AWSサービス名前空間名を設定します。このメンバーは，Yet another cloudwatch exporterのメトリック定義ファイルの場合だけ，必須で設定します。 Yet another cloudwatch exporter設定ファイル（jpc_ya_cloudwatch_exporter.yml）で指定した次の名前空間の名称を設定します。 <Auto-discovery job>のtypeで指定した名前空間^※ （例1）AWS/EC2 （例2）AWS/S3 1〜255文字で，次に示す文字を指定できます。半角英数字 `.`（ピリオド） `-`（ハイフン） `_`（アンダースコア） `/`（スラッシュ） `#`（ハッシュ） `:`（コロン）指定不可の文字を含む場合，KAJY24604-EまたはKAJY24605-Eのエラーメッセージが出力されます。

注※: Auto-discovery jobのtypeに指定できる名前空間（サービス）については，マニュアル「JP1/Integrated Management 3 - Manager 導入・設計ガイド」の「9.5.1(1)(k) Yet another cloudwatch exporterのIM管理ノードの作成」の，JP1/IM - AgentのYet another cloudwatch exporterが監視対象としてサポートするAWSの名前空間について説明している個所を参照してください。

ページの先頭へ

モデルファイルの設定内容（初期状態）とアラート定義例

Yet another cloudwatch exporterのメトリック定義ファイルのモデルファイルに記述されている各メトリックの設定内容（初期状態）とアラート定義例（アラート設定ファイル）を，次に示します。

aws_ec2_cpuutilization_average

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_ec2_cpuutilization_average
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_ec2_cpuutilization_average and $jp1im_TrendData_labels
resource_en	category	aws_ec2
	label	CPU utilization
	description	The percentage of the allocated EC2 compute units that are currently in use on the instance. For details, see the description of the CPUUtilization metric for AWS/EC2.
	unit	%
resource_ja	category	aws_ec2
	label	CPU使用率
	description	割り当てられた EC2 コンピュートユニットのうち，現在インスタンス上で使用されているものの比率。詳細はAWS/EC2のCPUUtilizationメトリックの説明を参照してください。
	unit	%
cloud_srv		AWS/EC2

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_ec2_cpuutilization_average(Yet another cloudwatch exporter)
      expr: 80 < aws_ec2_cpuutilization_average
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0601"
        jp1_pc_metricname: "aws_ec2_cpuutilization_average"
      annotations:
        jp1_pc_firing_description: "CPU使用率がしきい値(80%)を上回りました。value={{ $value }}%"
        jp1_pc_resolved_description: "CPU使用率がしきい値(80%)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_ec2_disk_read_bytes_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_ec2_disk_read_bytes_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		(aws_ec2_disk_read_bytes_sum and $jp1im_TrendData_labels) / 1024
resource_en	category	aws_ec2
	label	Amount of data read in KB
	description	Amount of data in KB read from all instance store volumes available to the instance. For more information, see the description of the DiskReadBytes metric of AWS EC2.
	unit	KB
resource_ja	category	aws_ec2
	label	読み取りキロバイト数
	description	インスタンスで利用できるすべてのインスタンスストアボリュームから読み取られたキロバイト数。詳細はAWS/EC2のDiskReadBytesメトリックの説明を参照してください。
	unit	キロバイト
cloud_srv		AWS/EC2

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_ec2_disk_read_bytes_sum(Yet another cloudwatch exporter)
      expr: 10240 < aws_ec2_disk_read_bytes_sum / 1024
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0602"
        jp1_pc_metricname: "aws_ec2_disk_read_bytes_sum"
      annotations:
        jp1_pc_firing_description: "インスタンスストアボリュームの読み取りキロバイト数がしきい値(10,240KB)を上回りました。value={{ $value }}KB"
        jp1_pc_resolved_description: "インスタンスストアボリュームの読み取りキロバイト数がしきい値(10,240KB)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_ec2_disk_write_bytes_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_ec2_disk_write_bytes_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		(aws_ec2_disk_write_bytes_sum and $jp1im_TrendData_labels) / 1024
resource_en	category	aws_ec2
	label	Amount of data written in KB
	description	Amount of data in KB written to all instance store volumes available to the instance. For more information, see the description of the DiskWriteBytes metric of AWS EC2.
	unit	KB
resource_ja	category	aws_ec2
	label	書き込みキロバイト数
	description	インスタンスで利用できるすべてのインスタンスストアボリュームに書き込まれたキロバイト数。詳細はAWS/EC2のDiskWriteBytesメトリックの説明を参照してください。
	unit	キロバイト
cloud_srv		AWS/EC2

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_ec2_disk_write_bytes_sum(Yet another cloudwatch exporter)
      expr: 10240 < aws_ec2_disk_write_bytes_sum / 1024
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0603"
        jp1_pc_metricname: "aws_ec2_disk_write_bytes_sum"
      annotations:
        jp1_pc_firing_description: "インスタンスストアボリュームの書き込みキロバイト数がしきい値(10,240KB)を上回りました。value={{ $value }}KB"
        jp1_pc_resolved_description: "インスタンスストアボリュームの書き込みキロバイト数がしきい値(10,240KB)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_lambda_errors_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_lambda_errors_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_lambda_errors_sum and $jp1im_TrendData_labels
resource_en	category	aws_lambda
	label	Number of invocations
	description	The number of invocations that result in a function error. For details, see the description of the Errors metric for AWS/Lambda.
	unit	count
resource_ja	category	aws_lambda
	label	呼び出し数
	description	関数エラーが発生した呼び出しの数。詳細はAWS/LambdaのErrorsメトリックの説明を参照してください。
	unit	個
cloud_srv		AWS/Lambda

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_lambda_errors_sum(Yet another cloudwatch exporter)
      expr: 0 < aws_lambda_errors_sum{dimension_Resource=""}
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0604"
        jp1_pc_metricname: "aws_lambda_errors_sum"
      annotations:
        jp1_pc_firing_description: "関数エラーが発生した呼び出しの数がしきい値(0個)を上回りました。value={{ $value }}個"
        jp1_pc_resolved_description: "関数エラーが発生した呼び出しの数がしきい値(0個)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_lambda_duration_average

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_lambda_duration_average
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_lambda_duration_average and $jp1im_TrendData_labels
resource_en	category	aws_lambda
	label	Event processing time
	description	The amount of time that your function code spends processing an event. For details, see the description of the Duration metric for AWS/Lambda.
	unit	msec
resource_ja	category	aws_lambda
	label	イベント処理時間
	description	関数コードがイベントの処理に費やす時間。詳細はAWS/LambdaのDurationメトリックの説明を参照してください。
	unit	ミリ秒
cloud_srv		AWS/Lambda

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_lambda_duration_average(Yet another cloudwatch exporter)
      expr: 5000 < aws_lambda_duration_average{dimension_Resource=""}
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0605"
        jp1_pc_metricname: "aws_lambda_duration_average"
      annotations:
        jp1_pc_firing_description: "関数コードがイベントの処理に費やす時間がしきい値(5000ミリ秒)を上回りました。value={{ $value }}ミリ秒"
        jp1_pc_resolved_description: "関数コードがイベントの処理に費やす時間がしきい値(5000ミリ秒)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_s3_bucket_size_bytes_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_s3_bucket_size_bytes_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		(aws_s3_bucket_size_bytes_sum and $jp1im_TrendData_labels) / (102410241024)
resource_en	category	aws_s3
	label	Amount of data stored
	description	The amount of data in GB stored in a bucket in the STANDARD storage class, INTELLIGENT_TIERING storage class, Standard-Infrequent Access (STANDARD_IA) storage class, OneZone-Infrequent Access (ONEZONE_IA), Reduced Redundancy Storage (RRS) class, Deep Archive Storage (S3 Glacier Deep Archive) class or, Glacier (GLACIER) storage class. For details, see the description of the BucketSizeBytes metric for AWS/S3.
	unit	GB
resource_ja	category	aws_s3
	label	保存データ量
	description	STANDARD ストレージクラス，INTELLIGENT_TIERING ストレージクラス，標準低頻度アクセス（STANDARD_IA）ストレージクラス，OneZone 低頻度アクセス（ONEZONE_IA），低冗長化ストレージ (RRS) クラス，ディープアーカイブストレージ（S3 Glacier Deep Archive），または Glacier （GLACIER）ストレージクラスのバケットに保存されているデータの量（ギガバイト単位）。詳細はAWS/S3のBucketSizeBytesメトリックの説明を参照してください。
	unit	ギガバイト
cloud_srv		AWS/S3

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_s3_bucket_size_bytes_sum(Yet another cloudwatch exporter)
      expr: 1024 < aws_s3_bucket_size_bytes_sum / (1024*1024*1024)
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0606"
        jp1_pc_metricname: "aws_s3_bucket_size_bytes_sum"
      annotations:
        jp1_pc_firing_description: "バケットの保存データ量がしきい値(1024GB)を上回りました。value={{ $value }}GB"
        jp1_pc_resolved_description: "バケットの保存データ量がしきい値(1024GB)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_s3_5xx_errors_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_s3_5xx_errors_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_s3_5xx_errors_sum and $jp1im_TrendData_labels
resource_en	category	aws_s3
	label	Number of 5xx server errors
	description	The number of HTTP 5xx server error status code requests made to an Amazon S3 bucket with a value of either 0 or 1. For details, see the description of the 5xx_errors metric for AWS/S3.
	unit	count
resource_ja	category	aws_s3
	label	5xxサーバエラー数
	description	Amazon S3バケットに対して行われた，値が0または1のHTTP 5xxサーバーエラーステータスコードリクエストの数。詳細はAWS/S3の5xx_errorsメトリックの説明を参照してください。
	unit	個
cloud_srv		AWS/S3

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_s3_5xx_errors_sum(Yet another cloudwatch exporter)
      expr: 0 < aws_s3_5xx_errors_sum
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0607"
        jp1_pc_metricname: "aws_s3_5xx_errors_sum"
      annotations:
        jp1_pc_firing_description: "バケットへのリクエストに対して，HTTP 5xx サーバーエラーステータスコードを返却される数が，しきい値(0個)を上回りました。value={{ $value }}個"
        jp1_pc_resolved_description: "バケットへのリクエストに対して，HTTP 5xx サーバーエラーステータスコードを返却される数が，しきい値(0個)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_dynamodb_consumed_read_capacity_units_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_dynamodb_consumed_read_capacity_units_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_dynamodb_consumed_read_capacity_units_sum and $jp1im_TrendData_labels
resource_en	category	aws_dynamo_db
	label	Number of read capacity units
	description	The total number of read capacity units consumed. For details, see the description of the ConsumedReadCapacityUnits metric for Amazon DynamoDB.
	unit	count
resource_ja	category	aws_dynamo_db
	label	読み込み容量ユニット数
	description	消費された読み込み容量ユニットの合計。詳細はAmazon DynamoDBのConsumedReadCapacityUnitsメトリックの説明を参照してください。
	unit	個
cloud_srv		AWS/DynamoDB

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_dynamodb_consumed_read_capacity_units_sum(Yet another cloudwatch exporter)
      expr: 600 < aws_dynamodb_consumed_read_capacity_units_sum
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0608"
        jp1_pc_metricname: "aws_dynamodb_consumed_read_capacity_units_sum"
      annotations:
        jp1_pc_firing_description: "消費された読み込み容量ユニットの合計数がしきい値(600個)を上回りました。value={{ $value }}個"
        jp1_pc_resolved_description: "消費された読み込み容量ユニットの合計数がしきい値(600個)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_dynamodb_consumed_write_capacity_units_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_dynamodb_consumed_write_capacity_units_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_dynamodb_consumed_write_capacity_units_sum and $jp1im_TrendData_labels
resource_en	category	aws_dynamo_db
	label	Number of write capacity units
	description	The total number of write capacity units consumed. For details, see the description of the ConsumedWriteCapacityUnits metric for Amazon DynamoDB.
	unit	count
resource_ja	category	aws_dynamo_db
	label	書き込み容量ユニット数
	description	消費された書き込み容量ユニットの合計。詳細はAmazon DynamoDBのConsumedWriteCapacityUnitsメトリックの説明を参照してください。
	unit	個
cloud_srv		AWS/DynamoDB

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_dynamodb_consumed_write_capacity_units_sum(Yet another cloudwatch exporter)
      expr: 600 < aws_dynamodb_consumed_write_capacity_units_sum
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0609"
        jp1_pc_metricname: "aws_dynamodb_consumed_write_capacity_units_sum"
      annotations:
        jp1_pc_firing_description: "消費された書き込み容量ユニットの合計数がしきい値(600個)を上回りました。value={{ $value }}個"
        jp1_pc_resolved_description: "消費された書き込み容量ユニットの合計数がしきい値(600個)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_states_execution_time_average

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_states_execution_time_average
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_states_execution_time_average and $jp1im_TrendData_labels
resource_en	category	aws_states
	label	Execution time
	description	The average of the interval, in milliseconds, from the start to the end of the execution of Step Functions. For details, see the description of the ExecutionTime metric for AWS Step Functions.
	unit	msec
resource_ja	category	aws_states
	label	実行時間
	description	Step Functionsの実行の開始時点から終了時点までの間隔の平均値（ミリ秒単位）。詳細はAWS Step FunctionsのExecutionTimeメトリックの説明を参照してください。
	unit	ミリ秒
cloud_srv		AWS/States

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_states_execution_time_average(Yet another cloudwatch exporter)
      expr: 5000 < aws_states_execution_time_average
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0610"
        jp1_pc_metricname: "aws_states_execution_time_average"
      annotations:
        jp1_pc_firing_description: "Step Functionsの実行時間がしきい値(5000ミリ秒)を上回りました。value={{ $value }}ミリ秒"
        jp1_pc_resolved_description: "Step Functionsの実行時間がしきい値(5000ミリ秒)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_states_executions_failed_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_states_executions_failed_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_states_executions_failed_sum and $jp1im_TrendData_labels
resource_en	category	aws_states
	label	Number of failed executions
	description	The total number of failed executions of Step Functions. For details, see the description of the ExecutionsFailed metric for AWS Step Functions.
	unit	count
resource_ja	category	aws_states
	label	実行失敗数
	description	Step Functionsの失敗した実行の合計数。詳細はAWS Step FunctionsのExecutionsFailedメトリックの説明を参照してください。
	unit	個
cloud_srv		AWS/States

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_states_executions_failed_sum(Yet another cloudwatch exporter)
      expr: 0 < aws_states_executions_failed_sum
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0611"
        jp1_pc_metricname: "aws_states_executions_failed_sum"
      annotations:
        jp1_pc_firing_description: "Step Functionsの実行失敗数がしきい値(0個)を上回りました。value={{ $value }}個"
        jp1_pc_resolved_description: "Step Functionsの実行失敗数がしきい値(0個)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_sqs_approximate_number_of_messages_delayed_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_sqs_approximate_number_of_messages_delayed_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_sqs_approximate_number_of_messages_delayed_sum and $jp1im_TrendData_labels
resource_en	category	aws_sqs
	label	Number of messages in the delay queue
	description	The total number of messages in the queue that are delayed and not available for reading immediately. For details, see the description of the ApproximateNumberOfMessagesDelayed metric for Amazon SQS.
	unit	count
resource_ja	category	aws_sqs
	label	遅延キューメッセージ数
	description	遅延が発生したため，すぐに読み取ることのできない，キューのメッセージの合計数。詳細はAmazon SQSのApproximateNumberOfMessagesDelayedメトリックの説明を参照してください。
	unit	個
cloud_srv		AWS/SQS

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_sqs_approximate_number_of_messages_delayed_sum(Yet another cloudwatch exporter)
      expr: 0 < aws_sqs_approximate_number_of_messages_delayed_sum
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0612"
        jp1_pc_metricname: "aws_sqs_approximate_number_of_messages_delayed_sum"
      annotations:
        jp1_pc_firing_description: "遅延キューメッセージ数がしきい値(0個)を上回りました。value={{ $value }}個"
        jp1_pc_resolved_description: "遅延キューメッセージ数がしきい値(0個)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

aws_sqs_number_of_messages_deleted_sum

■設定内容（初期状態）

メンバー名		設定内容（初期状態）
name		aws_sqs_number_of_messages_deleted_sum
default		false
メトリック定義ファイル用promql（$jp1im_TrendData_labelsを含む）		aws_sqs_number_of_messages_deleted_sum and $jp1im_TrendData_labels
resource_en	category	aws_sqs
	label	Number of messages in the deletion queue
	description	The total number of messages deleted from the queue. For details, see the description of the NumberOfMessagesDeleted metric for Amazon SQS.
	unit	count
resource_ja	category	aws_sqs
	label	削除キューメッセージ数
	description	キューから削除されたメッセージの合計数。詳細はAmazon SQSのNumberOfMessagesDeletedメトリックの説明を参照してください。
	unit	個
cloud_srv		AWS/SQS

■アラート定義例^※

groups:
  - name: yet_another_cloudwatch_exporter
    rules:
    - alert: aws_sqs_number_of_messages_deleted_sum(Yet another cloudwatch exporter)
      expr:  0 < aws_sqs_number_of_messages_deleted_sum
      for: 3m
      labels:
        jp1_pc_product_name: "/HITACHI/JP1/JPCCS2"
        jp1_pc_component: "/HITACHI/JP1/JPCCS/CONFINFO"
        jp1_pc_severity: "Error"
        jp1_pc_eventid: "0613"
        jp1_pc_metricname: "aws_sqs_number_of_messages_deleted_sum"
      annotations:
        jp1_pc_firing_description: "削除キューメッセージ数がしきい値(0個)を上回りました。value={{ $value }}個"
        jp1_pc_resolved_description: "削除キューメッセージ数がしきい値(0個)を下回りました。"

注※: 複数のアラートを同一の監視エージェントホストで定義する場合，「groups:」を重複して指定したり，同じグループ名を指定したnameを重複して指定したりしないように注意してください。

ページの先頭へ