3.14.3 ジョブ監視機能
(1) 概要
JP1/AJS3 - Manager 13-50以降と連携し,JP1/AJS3のジョブ情報をメトリックとして監視することで,ルートジョブネットの実行時間の推移をルートジョブネットの実行時間の性能問題を予兆検知やアノマリー検知し,統合オペレーション・ビューアーで可視化します。JP1/AJS3のルートジョブネットの実行時間をメトリックとするトレンドデータを,JP1/IM - Managerのトレンドデータ管理DBに保存し,統合オペレーション・ビューアーの[トレンド]タブや[ダッシュボード]タブに表示して監視できます。
統合オペレーション・ビューアーに表示するJP1/AJS3のジョブ情報のメトリックは,JP1/AJS3のメトリック定義ファイル(metrics_ajs_rootjobnet.conf)で定義します。
(2) 前提条件
ジョブ監視機能を使用する場合,次の前提条件があります。
-
連携するJP1/AJS3 - Managerのバージョンは,13-50以降である必要があります。
-
連携するJP1/AJS3のルートジョブネットの実行時間をメトリックとするトレンドデータが,JP1/IM - Managerのインテリジェント統合管理データベースのトレンドデータ管理DBに保存されている必要があります。※
-
統合オペレーション・ビューアーの[ダッシュボード]タブや[トレンド]タブに,トレンドデータが表示できる状態である必要があります。※
- 注※
-
JP1/AJS3連携の設定を実施し,JP1/AJS3のルートジョブネットの実行が完了している必要があります。
(3) 使用できるバージョンの組み合わせ(JP1/IM - Manager とJP1/IM - Agentの接続性)
ジョブ監視機能を使用できるバージョンの組み合わせを,次に示します。
-
JP1/IM - Manager 13-50以降
-
JP1/IM - Agent 13-50以降
(4) ユースケース
(a) JP1/AJS3のルートジョブネットの実行時間を予兆検知のアラートで監視して,実行時間の増加に対して事前に対処する
JP1/AJS3を使用したジョブ実行基盤の運用では,自動化されたバッチ業務は,ルートジョブネットとして実行されています。バッチ業務は,定刻までに処理が完了することが重要視されます。しかし,バッチ業務を長時間運用していると,実行時間が徐々に増加し,業務の処理が定刻までに完了しなくなるおそれがあります。そのため,実行時間が想定した範囲に収まっているかを監視します。
JP1/AJS3のルートジョブネットの実行時間の遅延を予兆検知のアラートで監視して,ルートジョブネットの実行時間の推移を統合オペレーション・ビューアーで可視化することで,実行時間の増加に対して,業務が定刻までに完了しなくなる前に対処できるようになります。
JP1/AJS3のルートジョブネットの実行時間の監視の詳細については,マニュアル「JP1/Automatic Job Management System 3 連携ガイド」の「JP1/IM3連携時のセットアップ」の説明を参照してください。
(b) メトリック定義ファイルのpromqlに範囲ベクトルセレクターを指定したメトリックについて,ダッシュボードのトレンドパネルのグラフを表示する
範囲ベクトルセレクター「$stepTime{minSeconds="最小秒数"}」の指定については,「3.15.6(4)(c) 取得するパフォーマンスデータについて」の「動的範囲ベクトルによるトレンドデータの集約表示」を参照してください。
メトリック定義ファイルのpromqlに範囲ベクトルセレクターとして,「$stepTime{minSeconds="最小秒数"}」を指定することで,範囲ベクトルに対して,ダッシュボードのトレンドデータの表示範囲に応じてすべてのデータが含まれるように動的に計算してトレンドデータを表示できるようになります。
例えば,ダッシュボードのトレンドパネルで,グラフの表示範囲をデフォルトより長い範囲に変更することを想定します。このとき,範囲ベクトルセレクターとして,固定値(1d)ではなく,「$stepTime{minSeconds=\"86400\"}」を指定することで,正確な値でグラフ表示できます。具体的には,7日(1週間)ごと49日間の「ルートジョブネットの実行時間」の平均値の傾向を,ダッシュボードのトレンドパネルのグラフで確認する場合,グラフに表示される値は,次のようになります。
■グラフを表示する条件
-
表示するメトリック:JP1/AJS3の「ルートジョブネットの実行時間」の平均値
-
「ルートジョブネットの実行時間」の負荷:毎週土日の48時間高負荷
-
グラフの表示範囲:2025/01/08(水) 00:00:00〜2025/02/19(水) 00:00:00(42日間)※
注※ 2025/01/01 00:00:00〜2025/02/19 00:00:00の49日間分のデータを表示します。
-
グラフのプロット数:7個
-
グラフの表示間隔:7日
-
トレンドデータの保存間隔:1日
■メトリック定義ファイルのpromqlの設定とグラフに表示される値
-
範囲ベクトルセレクターとして固定値(1d)を指定した場合
-
メトリック定義ファイルのpromql
(avg_over_time(ajs_rootjobnet_exectime[1d]) and $jp1im_TrendData_labels)
-
グラフに表示される値
プロットされるデータは,毎週水曜00:00:00の直前1日分のデータ(毎週火曜に実行した「ルートジョブネットの実行時間」の値)を元に計算するため,負荷が高い値を使わずに計算した値でグラフが表示されます。
-
-
範囲ベクトルセレクターとして「$stepTime{minSeconds=\"86400\"}」を指定した場合
-
メトリック定義ファイルのpromql
(avg_over_time(ajs_rootjobnet_exectime[$stepTime{minSeconds=\"86400\"}]) and $jp1im_TrendData_labels)
-
グラフに表示される値
プロットされるデータは,毎週水曜00:00:00の直前1週間分のデータを元に計算するため,負荷が高い値も使って計算した値でグラフが表示されます。範囲ベクトルセレクターが固定値の場合より,正確な値でグラフを表示できます。
-