Hitachi

Hitachi Microservices Platform - Paxos Commit Transaction Orchestrator ユーザーズガイド


付録C HMP-PCTOのメトリクス取得項目

ここでは、HMP-PCTOで取得するメトリクス項目について説明します。

表C‒1 メトリクスのMeter種別

Meter種別

説明

Counter

単調に増加する値

FunctionCounter

単調増加関数を追跡するカウンター

Gauge

上下する値

MultiGauge

複数のGauge

Timer

多数の短時間実行イベント

Prometheusサーバの標準のWeb UIで次のメトリクス項目名をクエリとして入力することでメトリクス情報が画面に出力されます。

表C‒2 システムの利用状況、およびJava VMの利用状況

Prometheus上の表記

Meter種別

tag

単位

説明

jvm_gc_memory_allocated_bytes_total

Counter

bytes

あるGCの実施後から、次のGCの実施までの、JavaヒープNew世代領域のメモリプールサイズの増加量です。

jvm_gc_memory_promoted_bytes_total

Counter

bytes

あるGCの実施前とGCの実施後での、JavaヒープOld世代領域のメモリプールサイズの増加量です。

jvm_memory_used_bytes

Gauge

bytes

Java VMの使用メモリ量です。

jvm_memory_max_bytes

Gauge

bytes

Java VMで使用できるメモリの最大量です。

process_files_open_files

Gauge

files

開いているファイル記述子の数です。

process_files_max_files

Gauge

files

ファイル記述子の最大数です。

system_cpu_usage

Gauge

システム(Kubernetesの場合、コンテナ環境)の最近のCPU使用率です。

使用率は0.0〜1.0(double型)の範囲で表されます。

process_cpu_usage

Gauge

Java VMプロセスの最近のCPU使用率です。

使用率は0.0〜1.0(double型)の範囲で表されます。

(凡例)−:該当しません。

注※ 独自Binderの場合だけ記載しています。

表C‒3 HMP-PCTOの性能を評価するための指標

Prometheus上の表記

Meter種別

tag

単位

説明

hmppcto_mediator_consensus_logs

MultiGauge

id=<ホスト名> status=<状態>

logs

ConsensusLogの状態ごとの件数です。

hmppcto_mediator_proposals_logs

MultiGauge

id=<ホスト名> status=<状態>

logs

Proposal Logの状態ごとの件数です。

grpc_server_processing_duration_seconds_max

Timer

seconds

gRPCサーバが呼び出し完了に掛かった時間の統計情報です。

grpc_client_processing_duration_seconds_max

Timer

seconds

gRPCクライアントが通信完了するまでに掛かった合計時間の統計情報(ネットワーク遅延を含む)です。

hmppcto_asynctask_duration_seconds

Timer

name=<クラス名>

seconds

非同期タスク(HMP-PCTO内部で実行する非同期送信処理)の所要時間の統計情報です。

hmppcto_asynctask_operations_total

FunctionCounter

name=<クラス名> kind=unique

operations

作成された非同期タスク(HMP-PCTO内部で実行する非同期送信処理)の数です。

hmppcto_asynctask_operations_total

FunctionCounter

name=<クラス名> kind=success

operations

正常に終了した非同期タスク(HMP-PCTO内部で実行する非同期送信処理)の数です。

hmppcto_asynctask_operations_total

FunctionCounter

name=<クラス名> kind=failure

operations

再試行された非同期タスク(HMP-PCTO内部で実行する非同期送信処理)の数と失敗した非同期タスクの数です。

hmppcto_asynctask_operations_total

FunctionCounter

name=<クラス名> kind=retry

operations

実行中に例外が発生したため、再試行する予定の非同期タスク(HMP-PCTO内部で実行する非同期送信処理)の数です。

hmppcto_asynctask_queued_operations

Gauge

name=<クラス名>

operations

キュー内の非同期タスク(HMP-PCTO内部で実行する非同期送信処理)の数です。

hmppcto_participant_transactions_inProcess_operations

MultiGauge

id=<ホスト名> status=<状態>

operations

処理中のトランザクションブランチ数です。

hmppcto_participant_transactions_terminated_operations

MultiGauge

id=<ホスト名> status=<状態>

operations

完了したトランザクションブランチ数です。

hmppcto_mediator_consensus_duration_seconds

Timer

id=<ホスト名>

seconds

ConsensusLogの処理時間です。

hmppcto_participant_eads_duration_seconds

Timer

id=<ホスト名>

seconds

EADS APIの処理時間です。トライアル版では出力できません。

hmppcto_executor_active_threads

Gauge

threads

アクティブにタスクを実行しているスレッドのおおよその数です。

hmppcto_executor_queued_tasks

Gauge

tasks

実行待ちのタスクのおおよその数です。

tomcat_threads_busy_threads

Gauge

threads

Spring Boot組み込みTomcatで、ビジー状態のスレッド数

(凡例)−:該当しません。

注※ 独自Binderの場合だけ記載しています。

表C‒4 Jaeger-collectorが出力するメトリクス

メトリクス取得項目

説明

出力するコンポーネント

jaeger_collector_queue_length

Jaeger-collectorの内部キュー内に存在するアイテム数

Jaeger-collector

jaeger_collector_spans_dropped_total

Jaeger-collectorの内部キューに存在し、Elasticsearchに送信されることなく、上書きされてしまったSpanの数

Jaeger-collector

表C‒5 Prometheusが出力するメトリクス

メトリクス取得項目

説明

出力するコンポーネント

up

スクレイプに成功したときは「1」、失敗したときは「0」を示すメトリックです。HMP-PCTOのKubernetesアプリケーションの稼働監視に利用できます。

Prometheus server

scrape_duration_seconds

スクレイプに掛かった時間を示すメトリックです。通常の運用では使用しません。

スクレイプが想定した時間内に終わらなかった場合の調査などで使用します。

Prometheus server

scrape_samples_post_metric_relabeling

メトリックのリラベル後に残ったサンプル数を示すメトリックです。通常の運用では使用しません。

環境構築時のデータ数の確認で使用します。

Prometheus server

scrape_samples_scraped

HMP-PCTOのKubernetesアプリケーションがスクレイプで返却したサンプル数を示すメトリックです。通常の運用では使用しません。

環境構築時のデータ数の確認で使用します。

Prometheus server

scrape_series_added

新しく生成した系列のおおよその数を示すメトリックです。通常の運用では使用しません。

Prometheus server