2.11 マネージャーの処理に影響を及ぼすエージェント障害時の対処
サブミットジョブを使用している場合,特定のエージェントの障害によって,マネージャーの処理に影響を及ぼすような事象が発生したときに,回復するために緊急実行コマンドを使用できます。
緊急実行コマンドを使用すると,エージェントでの障害発生時にジョブ実行状況の確認,操作ができます。緊急実行コマンドは通常のコマンドとは異なる通信経路に対してジョブ実行制御を要求するため,緊急で実行できます。
- 注意事項
-
緊急実行コマンドは,エージェントの障害から迅速に復旧させる目的だけに使用してください。常に緊急実行コマンドを使用する運用をした場合,障害発生時に対応できなくなるおそれがあります。
緊急実行コマンドとして実行できるコマンドを次の表に示します。
なお,次の表のコマンドに-emオプションを指定することで緊急実行コマンドとして使用できます。
機能 |
コマンド |
用途 |
---|---|---|
キューの受付口・取出口を閉じる。 |
jpqqueclose |
キューの受付口・取出口を閉じることで,追加ジョブが投入できないようにし,障害の拡大を防止する。 |
キューの受付口・取出口を開く。 |
jpqqueopen |
エージェントと連携できるようになった場合に,いったん閉じたキューの受付口・取出口を開く。 |
キュー情報を表示する。 |
jpqqueshow |
キュー属性を変更するとき,キュー内にあるキューイングジョブ数と実行中ジョブ数を確認する。 |
キューのジョブ数・最大値・警告値を変更する。 |
jpqquealt |
キュー属性を変更後,一時的にキューに保持できる最大値を大きくすることによって,復旧後の運用継続が見込める場合に使用する。 |
エージェントの実行多重度を変更する。 |
jpqagtalt |
優先ジョブの実行のために,エイリアスエージェントの制御を実行多重度によって行う場合に使用する。 |
エージェント情報を表示する。 |
jpqagtshow |
エージェント属性を変更するとき,エージェントで実行中のジョブ数を確認する。 |
エージェント複数接続時の優先順位を変更する。 |
jpqagtlink |
一つのキューから複数のエージェントに接続している場合のエージェント分散起動優先順位を変更する。 |
ジョブをキャンセルする。 |
jpqjobcan |
実行待ち,保留,時間待ち状態になっているジョブの実行をキャンセルする。 |