Hitachi

Hitachi Microservices Platform - Paxos Commit Transaction Orchestrator ユーザーズガイド


4.5.1 Metrics Serverでメトリクスを監視する場合の障害対策

Metrics Serverでメトリクスを監視する場合に、HMP-PCTOのPodが想定どおりにスケーリングしないときの主な原因と対策を次の表に示します。

表4‒10 オンプレミス環境またはRed Hat OpenShift Container Platform環境の場合の、オートスケールの障害の主な原因と対策(Metrics Serverでメトリクスを監視するとき)

項番

現象

主な原因

対策

1

負荷に応じてスケールアウト/スケールインしない

Metrics Serverに障害が発生している

Metrics Serverの公式ドキュメントを参照してMetrics Serverの障害について対策してください。そのあと、「4.2.3 Metrics Serverのデプロイ(オンプレミス環境またはRed Hat OpenShift Container Platform環境限定)」を再度実施してください。

2

HPAに障害が発生している

HPAの公式ドキュメントを参照してHPAの障害について対策してください。そのあと、「4.2.6 HPAのデプロイ」を再度実施してください。

3

HPAのKubernetesマニフェストでのスケーリングに関する設定が誤っている

注※

Prometheusで「sum(up)by(label_app_kubernetes_io_name)」クエリを実行すると、オートスケール対象の各KubernetesアプリケーションのPod数の推移を確認できます。Prometheusのクエリの実行方法は、「(a) PrometheusサーバのWeb UIによる参照」を参照してください。

なお、label_app_kubernetes_io_nameラベルは、Kubernetesマニフェストの.spec.template.metadata.labelsのapp.kubernetes.io/nameに指定した値です。label_app_kubernetes_io_nameラベルを表示するための設定方法については、「3.7.14 PrometheusのKubernetesマニフェスト作成」を参照してください。

表4‒11 Microsoft Azure環境の場合の、オートスケールの障害の主な原因と対策(Metrics Serverでメトリクスを監視するとき)

項番

現象

主な原因

対策

1

負荷に応じてスケールアウト/スケールインしない

Metrics Serverに障害が発生している

Microsoft Azureの公式ドキュメント、およびMetrics Serverの公式ドキュメントを参照してMetrics Serverの障害について対策してください。

2

HPAに障害が発生している

Microsoft Azureの公式ドキュメント、およびHPAの公式ドキュメントを参照してHPAの障害について対策してください。そのあと、「4.2.6 HPAのデプロイ」を再度実施してください。

3

HPAのKubernetesマニフェストでのスケーリングに関する設定が誤っている

注※

Prometheusで「sum(up)by(label_app_kubernetes_io_name)」クエリを実行すると、オートスケール対象の各KubernetesアプリケーションのPod数の推移を確認できます。Prometheusのクエリの実行方法は、「(a) PrometheusサーバのWeb UIによる参照」を参照してください。

なお、label_app_kubernetes_io_nameラベルは、Kubernetesマニフェストの.spec.template.metadata.labelsのapp.kubernetes.io/nameに指定した値です。label_app_kubernetes_io_nameラベルを表示するための設定方法については、「3.7.14 PrometheusのKubernetesマニフェスト作成」を参照してください。

表4‒12 Google Cloud Platform環境の場合の、オートスケールの障害の主な原因と対策(Metrics Serverでメトリクスを監視するとき)

項番

現象

主な原因

対策

1

負荷に応じてスケールアウト/スケールインしない

Metrics Serverに障害が発生している

Google Cloud Platformの公式ドキュメント、およびMetrics Serverの公式ドキュメントを参照してMetrics Serverの障害について対策してください。

2

HPAに障害が発生している

Google Cloud Platformの公式ドキュメント、Microsoft Azureの公式ドキュメント、およびHPAの公式ドキュメントを参照してHPAの障害について対策してください。そのあと、「4.2.6 HPAのデプロイ」を再度実施してください。

3

HPAのKubernetesマニフェストでのスケーリングに関する設定が誤っている

注※

Prometheusで「sum(up)by(joy)」クエリを実行すると、オートスケール対象の各KubernetesアプリケーションのPod数の推移を確認できます。Prometheusのクエリの実行方法は、「(a) PrometheusサーバのWeb UIによる参照」を参照してください。