Hitachi

uCosminexus Batch Job Execution Server 使用の手引


4.10.1 クラスタシステムおよびクラスタ運用の概要

ここでは,クラスタシステムおよびバッチジョブ実行システムのクラスタ運用の概要について説明する。

〈この項の構成〉

(1) クラスタシステムの概要

クラスタシステムとは,複数のサーバシステムを連携して1つのシステムとして運用するシステムで,1つのサーバで障害が発生しても,別のサーバで業務を継続できるようにすることを目的としている。

クラスタシステムは,処理を実行するホストと,障害が発生したときに処理を引き継げるように待機しているホストで構成されている。業務の実行中のサーバを実行系サーバ,実行系の障害時に業務を引き継げるよう待機しているサーバを待機系サーバと呼ぶ。障害発生時は,実行系サーバから待機系サーバに処理を引き継いで業務の停止を防ぐ。この障害時に処理を引き継ぐことをフェールオーバーという。

フェールオーバーはJP1の論理ホスト単位で実施される。JP1と連携するアプリケーションは,フェールオーバーして業務を継続するために,JP1の論理ホスト環境で動作させる必要がある。

クラスタシステム構成のJP1の論理ホストは,サービスとして動作するアプリケーション,共有ディスク,および論理IPアドレスの3つの要素で構成されている。サービスとして動作するJP1やバッチジョブ実行システムなどのアプリケーションは,共有ディスクにデータを格納し,論理IP アドレスで通信を行う。

クラスタシステム構成のJP1の論理ホストを構成する各要素を次の表に示す。

表4‒7 クラスタシステム構成のJP1の論理ホストの構成要素

クラスタシステム構成のJP1の論理ホストの構成要素

構成要素の説明

サービス

クラスタシステムで実行するJP1やバッチジョブ実行システムなどのアプリケーションである。実行系サーバで障害が発生すると,待機系サーバで同じ名称のサービスを起動し,処理を引き継ぐ。

共有ディスク

実行系と待機系の両方に接続されたディスク装置である。フェールオーバー時に引き継ぐ情報(定義情報,実行状況など)を保存すると,実行系サーバで障害が発生した場合,待機系サーバが共有ディスクへの接続を引き継ぐ。

論理IPアドレス

実行系サーバの動作中に割り当てられるIPアドレスである。実行系サーバで障害が発生したときは,同じ論理IPアドレスの割り当てを待機系サーバが引き継ぐ。そのため,クライアントからは同じIPアドレスでアクセスでき,1つのサーバが常に動作しているように見える。

正常時およびフェールオーバー後のアクセスを次の図に示す。

図4‒14 正常時およびフェールオーバー後のアクセス

[図データ]

実行系サーバが稼働している場合は,実行系サーバで共有ディスクや論理IPアドレスが割り当てられてサービスが動作する。実行系サーバで障害が発生した場合,待機系サーバが共有ディスクと論理IPアドレスを引き継ぎ,実行系サーバと同じサービスを起動する。フェールオーバーによって物理的なサーバが変わった場合,待機系サーバが共有ディスクと論理IPアドレスを引き継ぐため,クライアントには同じIPアドレスのサーバが動作しているように見える。

(2) バッチジョブ実行システムのクラスタ運用の概要

ここでは,クラスタシステムでバッチジョブ実行システムを運用する概要について説明する。バッチジョブ実行システムはクラスタシステムに対応している。

クラスタシステムでバッチジョブ実行システムを運用するためには,論理ホスト環境のJP1と連携する必要がある。論理ホスト環境のJP1と連携していれば,バッチジョブ実行システムの物理ホスト環境でも論理ホスト環境でもどちらともクラスタシステムに対応できる。また,フェールオーバー時に引き継ぎが必要なデータを格納するための共有ディスク,および論理IPアドレスが必要となる。JP1のセットアップについては,JP1のマニュアルを参照すること。クラスタシステムで実行されるバッチジョブ実行システムは,共有ディスクに格納したデータを使用し,フェールオーバー時に実行系から待機系に引き継いで処理を続けることができる。バッチジョブ実行システムが共有ディスクに格納する必要のあるデータはスプールである。

バッチジョブ実行システムでのクラスタ運用の概要を次の図に示す。

図4‒15 バッチジョブ実行システムでのクラスタ運用の概要

[図データ]