4.5.1 Metrics Serverでメトリクスを監視する場合の障害対策
Metrics Serverでメトリクスを監視する場合に、HMP-PCTOのPodが想定どおりにスケーリングしないときの主な原因と対策を次の表に示します。
|
項番 |
現象 |
主な原因 |
対策 |
|---|---|---|---|
|
1 |
負荷に応じてスケールアウト/スケールインしない※ |
Metrics Serverに障害が発生している |
Metrics Serverの公式ドキュメントを参照してMetrics Serverの障害について対策してください。そのあと、「4.2.3 Metrics Serverのデプロイ(オンプレミス環境またはRed Hat OpenShift Container Platform環境限定)」を再度実施してください。 |
|
2 |
HPAに障害が発生している |
HPAの公式ドキュメントを参照してHPAの障害について対策してください。そのあと、「4.2.6 HPAのデプロイ」を再度実施してください。 |
|
|
3 |
HPAのKubernetesマニフェストでのスケーリングに関する設定が誤っている |
|
- 注※
-
Prometheusで「sum(up)by(label_app_kubernetes_io_name)」クエリを実行すると、オートスケール対象の各KubernetesアプリケーションのPod数の推移を確認できます。Prometheusのクエリの実行方法は、「(a) PrometheusサーバのWeb UIによる参照」を参照してください。
なお、label_app_kubernetes_io_nameラベルは、Kubernetesマニフェストの.spec.template.metadata.labelsのapp.kubernetes.io/nameに指定した値です。label_app_kubernetes_io_nameラベルを表示するための設定方法については、「3.7.14 PrometheusのKubernetesマニフェスト作成」を参照してください。
|
項番 |
現象 |
主な原因 |
対策 |
|---|---|---|---|
|
1 |
負荷に応じてスケールアウト/スケールインしない※ |
Metrics Serverに障害が発生している |
Microsoft Azureの公式ドキュメント、およびMetrics Serverの公式ドキュメントを参照してMetrics Serverの障害について対策してください。 |
|
2 |
HPAに障害が発生している |
Microsoft Azureの公式ドキュメント、およびHPAの公式ドキュメントを参照してHPAの障害について対策してください。そのあと、「4.2.6 HPAのデプロイ」を再度実施してください。 |
|
|
3 |
HPAのKubernetesマニフェストでのスケーリングに関する設定が誤っている |
|
- 注※
-
Prometheusで「sum(up)by(label_app_kubernetes_io_name)」クエリを実行すると、オートスケール対象の各KubernetesアプリケーションのPod数の推移を確認できます。Prometheusのクエリの実行方法は、「(a) PrometheusサーバのWeb UIによる参照」を参照してください。
なお、label_app_kubernetes_io_nameラベルは、Kubernetesマニフェストの.spec.template.metadata.labelsのapp.kubernetes.io/nameに指定した値です。label_app_kubernetes_io_nameラベルを表示するための設定方法については、「3.7.14 PrometheusのKubernetesマニフェスト作成」を参照してください。
|
項番 |
現象 |
主な原因 |
対策 |
|---|---|---|---|
|
1 |
負荷に応じてスケールアウト/スケールインしない※ |
Metrics Serverに障害が発生している |
Google Cloud Platformの公式ドキュメント、およびMetrics Serverの公式ドキュメントを参照してMetrics Serverの障害について対策してください。 |
|
2 |
HPAに障害が発生している |
Google Cloud Platformの公式ドキュメント、Microsoft Azureの公式ドキュメント、およびHPAの公式ドキュメントを参照してHPAの障害について対策してください。そのあと、「4.2.6 HPAのデプロイ」を再度実施してください。 |
|
|
3 |
HPAのKubernetesマニフェストでのスケーリングに関する設定が誤っている |
|
- 注※
-
Prometheusで「sum(up)by(joy)」クエリを実行すると、オートスケール対象の各KubernetesアプリケーションのPod数の推移を確認できます。Prometheusのクエリの実行方法は、「(a) PrometheusサーバのWeb UIによる参照」を参照してください。