Hitachi

uCosminexus Grid Processing Server 使用の手引


5.6.1 障害発生時の系切り替えの流れ

〈この項の構成〉

(1) グリッドジョブ管理ホストに障害が発生した場合のフェールオーバー

LinuxまたはAIXで,グリッドジョブ管理ホストに障害が発生した場合のフェールオーバーの流れを次に示します。

  1. 障害発生時に,実行系のuGPS - Managerをgpstopコマンド(-fオプション)で強制停止する(uGPS管理者で実行)。また,ジョブマネージャデーモンをgpjmdctlコマンド(stopオプション)で停止する。

  2. 共有ディスク上にあるグリッドジョブステータスファイルを待機系に引き継ぐ。

  3. 待機系のジョブマネージャデーモンをgpjmdctlコマンド(startオプション)で起動する(すでに起動している場合は,起動不要)。また,uGPS - Managerをgpstartコマンド(-nオプション)で強制的に正常開始する(uGPS管理者で実行)。

  4. gpjmrcvコマンドで,ステータスファイルからグリッドプロパティ情報を正常な状態に回復する(uGPS管理者で実行)。

  5. 正常な状態に回復されたグリッドプロパティに関連するグリッドジョブに対して,必要に応じて手動で再実行し,引き続き業務を運用する。

Windowsで,グリッドジョブ管理ホストに障害が発生した場合のフェールオーバーの流れを次に示します。

  1. 障害発生時に,実行系のOpenTP1を操作画面などで強制停止する(OpenTP1管理者で実行)。また,OSの操作でジョブマネージャデーモンサービスを停止する。

  2. 共有ディスク上にあるグリッドジョブステータスファイルを待機系に引き継ぐ。

  3. 待機系のジョブマネージャデーモンサービスをOS操作で起動する(すでに起動している場合は,起動不要)。また,OpenTP1を操作画面などで強制的に正常開始する(OpenTP1管理者で実行)。

  4. gpjmrcvコマンドで,ステータスファイルからグリッドプロパティ情報を正常な状態に回復する(OpenTP1管理者で実行)。

  5. 正常な状態に回復されたグリッドプロパティに関連するグリッドジョブに対して,必要に応じて手動で再実行し,引き続き業務を運用する。

(2) グリッドプロパティ管理ホストに障害が発生した場合のフェールオーバー

LinuxまたはAIXで,グリッドプロパティ管理ホストに障害が発生した場合のフェールオーバーの流れを次に示します。

  1. 障害発生時に,実行系のuGPS - Managerをgpstopコマンド(-fオプション)で強制停止する(uGPS管理者で実行)。

  2. 共有ディスク上にあるグリッドプロパティ情報ファイルを待機系に引き継ぐ。

  3. 待機系のuGPS - Managerをgpstartコマンド(-nオプション)で強制的に正常開始する(uGPS管理者で実行)。

  4. gpdmrcvコマンドで,ステータスファイルからグリッドプロパティ情報を正常な状態に回復する(uGPS管理者で実行)。

  5. 正常な状態に回復されたグリッドプロパティに関連するグリッドジョブに対して,必要に応じて手動で再実行し,引き続き業務を運用する。

Windowsで,グリッドプロパティ管理ホストに障害が発生した場合のフェールオーバーの流れを次に示します。

  1. 障害発生時に,実行系のOpenTP1を操作画面などで強制停止する(OpenTP1管理者で実行)。

  2. 共有ディスク上にあるグリッドプロパティ情報ファイルを待機系に引き継ぐ。

  3. 待機系のOpenTP1を操作画面などで強制的に正常開始する(OpenTP1管理者で実行)。

  4. gpdmrcvコマンドで,ステータスファイルからグリッドプロパティ情報を正常な状態に回復する(OpenTP1管理者で実行)。

  5. 正常な状態に回復されたグリッドプロパティに関連するグリッドジョブに対して,必要に応じて手動で再実行し,引き続き業務を運用する。