Hitachi

高信頼化システム監視機能 HAモニタ Linux(R)(x86)編


用語解説

(英字)

aliveメッセージ

系と系との間で相手が正常であるかどうかを知るために,一定の周期で発行するメッセージです。

HAモニタ Extension

HAモニタのオプション製品です。HAモニタ Extensionを導入することによって,大規模なシステム構成での系切り替え制御に対応できるようになります。

HAモニタとのインタフェースを持たないプログラム

HAモニタと専用のインタフェースを持たないプログラムのことです。待機系のプログラムを事前に起動させておいたり,サーバ障害を監視したりするなどのHAモニタの機能を一部使用できません。

HAモニタでは,HAモニタとのインタフェースを持つプログラムをモニタモードで運用する場合と,HAモニタとのインタフェースを持たないプログラムを使用する場合とで,制限される機能に差はありません。

HAモニタとのインタフェースを持つプログラム

HAモニタと専用のインタフェースを持つプログラムのことです。HAモニタとのインタフェースを持つプログラムをサーバモードで運用すると,系障害とサーバ障害の両方をHAモニタが監視します。

HAモニタは,HAモニタとのインタフェースを持つプログラムを監視して,プログラム自身が検知できない障害が発生した場合,系切り替えをします。

IPアドレス

IPプロトコルで使われるアドレスを,IPアドレスといいます。IPプロトコルとは,OSI基本参照モデルでいうネットワーク層に当たるプロトコルです。ネットワーク層では,データを転送するための経路を確立したり,経路を決めたりするアドレスを管理しています。

LANアダプタ

コンピュータとLANを接続するためのデータ変換用のハードウェアです。

LVM

カーネルの機能の一つで,Logical Volume Managerの略です。LVMを使用すると,幾つかの物理ディスク装置をボリュームグループとしてグループ化し,任意の数とサイズの論理ボリュームに割り当てられます。

なお,このマニュアルでのLVMは,LVM2のことを指します。

N+Mコールドスタンバイ構成

BladeSymphonyの場合で,業務を運用中のサーバモジュールでハードウェア障害が発生したときに,JP1/ServerConductorまたはHCSMを利用して予備のサーバモジュールに切り替えられるシステム構成のことです。1台または複数台の予備のサーバモジュールを用意するため,障害に対する信頼性が向上します。

OSパニック

OSのカーネルパニックのことです。

TCP/IP

UNIXを使用したコンピュータ間の接続などに用いられる,標準的な通信プロトコルです。「TCP」と「IP」の,二つのプロトコルに対応しています。

UAP

ユーザの業務をプログラムとして作成したものです。モニタモードのサーバの場合に,プログラムとして使用できます。HAモニタでは,UAPからAPIを発行することで,UAPを監視できます。

UDP

UNIXを使用したコンピュータ間の接続などに用いられる,標準的な通信プロトコルです。このようなプロトコルとしてはTCPも利用されますが,UDPはTCPに比べ転送速度が速く信頼性が低いという特徴があります。

(ア行)

イベントID

UNIXシステム内で発生した特定の事象(イベント)を管理するために,イベントに付ける番号です。

エイリアスIPアドレス機能

一つのLANアダプタに複数のIPアドレスを割り当てることで,異なるIPアドレスで一つのLANアダプタを共用できる機能です。

親サーバ

あるサーバを起動,または系切り替えを開始するために,あらかじめ起動完了している必要のあるサーバです。サーバグループの親子関係では親に該当します。サーバ対応の環境設定で指定します。

(カ行)

カーネル

OSの中核部分のプログラムです。タスク管理,メモリ管理,入出力管理などをします。

稼働報告

サーバが一定時間ごとにHAモニタに送信する情報です。HAモニタはこの情報を基にサーバを監視します。

可搬媒体

プログラムやデータを記憶させて持ち運べる,DATなどの記憶媒体です。

起動リトライ機能

系切り替え時,切り替え先の系でリソースの接続やサーバの起動に失敗し,ほかに切り替えできる系がない場合,切り替え先の系でサーバの起動を自動的にリトライする機能です。

サーバの起動リトライは,系切り替え可能状態になるまで,または指定されたリトライ回数まで行います。

モニタモードの場合,系切り替え後,実行サーバで障害が発生したときでも起動リトライできます。

筐体

コンピュータ本体や周辺機器を収納するケースです。使用しているマシンの機種がBladeSymphonyの場合,筐体を「シャーシ」と呼びます。一つのシャーシには複数の系を構成できます。

共有リソース

共有ディスクやLANなど,実行系および待機系の系間で共有するリソースのことです。HAモニタが制御する共有リソースには,共有ディスク,ファイルシステム,およびLANがあります。共有リソースは,サーバ単位で制御します。

また,リソースサーバを使用し,サーバグループ間で共有リソースを共用することもできます。

クライアント

プログラムが提供する各種のサービスを利用するマシン(ノード)です。

クラスタ型構成

1台のサーバシステムの限界を超えるシステムを構築するための構成です。複数のサーバシステムを高速LANで接続し,個々のサーバシステムに処理を分散させます。クライアントからは,一つのサーバシステムとして処理できます。

CPU単位でサーバが稼働するシステムの単位を示します。システムを構成するハードウェア,およびシステム上で稼働するプログラムを総称して「」といいます。

系切り替え

業務を実行しているシステム(系)やサーバに障害が発生した場合に,待機しているシステム(系)やサーバに業務を引き継ぐ機能のことです。

系切り替え待ち状態

実行系の障害時に待機系が実行系のリセットに失敗し,何らかの原因で実行系のサーバの状態が確認できない場合,待機系で実行サーバを起動すると実行サーバの二重起動が発生することがあります。これを防ぐために,待機系での実行サーバの起動をいったん待たせます。この状態の実行サーバを系切り替え待ち状態であるといいます。系切り替え待ち状態のサーバは,ユーザが操作するまでは実行サーバとして起動されません。

系のスローダウン

系全体の実行処理時間が通常以上に長くなることです。限度を超えたプログラム数の実行や,プログラム間の通信不良などが原因で起こります。

現用系

起動してから最初に業務処理を実行するシステム(系)です。

コアファイル

プログラムが異常終了時に,そのプロセスのメモリ情報(モジュールトレース情報)が格納されるOS特定のファイルです。なお,コアファイルは,場合によっては作成されません。コアファイルがあると,ユーザ作成のプログラムに異常が起きた場合などに,OSのコマンドを使ってプログラムのデバッグができます。

子サーバ

親サーバの起動完了後に,起動開始するサーバです。サーバグループの親子関係では子に該当します。

(サ行)

サーバ

要求に応じて業務を処理するサービスです。このマニュアルでは,系切り替えの単位としてのプログラムを「サーバ」といいます。

サーバには大きく分けて,サーバモードのサーバと,モニタモードのサーバがあります。

サーバシステムの二重化

サーバが稼働するシステムのマシン,プログラム,およびリソースなどを二つ用意する(または二重化できるものを共有させる)ことによって,システム全体の信頼性や稼働率を高めることです。

サーバのスローダウン

サーバの実行処理時間が通常以上に長くなることです。プログラムの無限ループ,リソースの競合などが原因で起こります。

サーバ引き継ぎ情報

実行サーバと待機サーバの間にペアが成立した際,実行サーバから待機サーバに引き継がれる情報です。ユーザコマンド内でサーバ間のやり取りが必要な場合に,HAモニタのサーバ引き継ぎ情報設定・表示コマンド(moninfo -pコマンド)で設定しておき,サーバ引き継ぎ情報設定・表示コマンド(moninfo -gコマンド)で参照・表示します。

サーバモード

サーバの運用方法の一つで,プログラムがHAモニタとのインタフェースを持つ場合だけ選択できます。サーバをサーバモードで運用すると,系障害とサーバ障害の両方をHAモニタが監視します。

再起動待ち状態

サーバ対応の環境設定のswitchtypeオペランドで,restartまたはmanualを指定した実行サーバにサーバ障害が発生した場合,実行サーバを停止させないで,実行サーバが再起動するのを待たせます。この状態の実行サーバを再起動待ち状態であるといいます。

システムダンプ

特定のプログラムに限定できない障害情報を,可搬媒体に格納するOSの機能です。システムダンプでは,メモリ情報,スワップ領域(仮想メモリ)の情報,および処理装置固有の情報を取得できます。一般に,システムのどこに原因があるのかわからない障害時にシステムダンプを使います。

実行系

実行サーバを稼働させて,業務処理を実行しているシステム(系)です。

実行サーバ

現在,業務処理を実行しているサーバです。

実行サーバの起動待ち状態

待機サーバの起動時,何らかの原因で他系の実行サーバの起動が確認できない場合があります。このとき,実行サーバの状態が確認できるまで待機サーバの起動を待たせます。このような待機サーバを,実行サーバの起動待ち状態であるといいます。起動待ち状態の待機サーバはユーザの操作待ちになり,実行サーバの起動開始が確認できるようになったら,待機サーバとして起動させます。

制御グループID

HA Boosterが管理する,個々の制御グループに割り当てた値です。制御グループは,HA Boosterがアクセス制御の対象とするディスクデバイスの集まりです。HA Boosterを使用する場合,サーバ対応の環境設定に設定する必要があります。

(タ行)

待機系

待機サーバを稼働させて,障害に備えて待機しているシステム(系)です。

待機サーバ

現在,実行サーバの障害に備えて待機しているサーバです。

(ハ行)

パーティション

サーバマシンを複数の区画に分割し,それぞれを一つの仮想的なサーバマシンとして動作させる機能を,パーティショニングといいます。また,この区画をパーティションといいます。

BladeSymphonyの場合,一つの筐体(シャーシ)に複数のプロセサを搭載できることから,個々のプロセサをパーティションと呼ぶことがあります。また,日立サーバ論理分割機構(Virtage)を利用すると,プロセサ内に論理パーティション(LPAR)を構成できます。

排他サーバ

待機系に別のサービスを提供する待機サーバが複数ある場合,系切り替えによって複数の実行サーバが同時に稼働するのを避けることができます。

ある待機サーバが実行サーバとして稼働すると,同じ系で稼働しているほかの待機サーバをHAモニタが停止します。この停止される待機サーバのことを排他サーバと呼びます。

排他制御

システムのリソースに対して複数の要求が競合した場合,同時更新やデッドロックを防ぐための制御のことです。HAモニタでは,共有ディスクが,実行サーバと待機サーバの両方から同時に更新されるのを防ぐ機能を,「排他制御機能」といいます。

プログラム

業務を実際に実行するプログラム(アプリケーション)のことです。HAモニタは,プログラムを系切り替え構成にすることで冗長化し,システムの信頼性を向上します。

プログラムは,HAモニタとのインタフェースを持つプログラムと持たないプログラムに分けられます。

(マ行)

マルチスタンバイ機能

一つの実行サーバに対して,複数の待機サーバを準備するための機能のことです。

一つの実行サーバに対して一つの待機サーバを準備する場合に比べると,現用系の障害が復旧するまでの間も,システムの障害に備えることができるという特長があります。

メッセージログ

出力されるメッセージを特定のファイル(メッセージログファイル)に格納するOSの機能です。

モジュールトレース情報

HAモニタ内のモジュール処理の流れを,モジュールトレースバッファ(コアファイル)に取得したものです。モジュールトレース情報は,可搬媒体に移送して解析します。

モニタモード

サーバの運用方法の一つです。サーバをモニタモードで運用する場合,待機系のサーバを事前に起動させておいたり,サーバ障害を監視したりするなどの,HAモニタの機能の一部を使用できません。ただし,モニタモードのプログラム管理機能を使用すれば,使用できない機能の一部を使用することもできます。

(ヤ行)

ユーザコマンド

ユーザが作成するコマンドです。HAモニタでは,事前にユーザコマンドを登録しておくことで,サーバの状態変化に対するHAモニタの処理を契機に,ユーザコマンドを自動発行できます。ユーザコマンドを使用すると,HAモニタが制御しないリソースを共有リソースとして使用できます。

予備系

起動時に最初に稼働状態で待機するシステム(系)です。

(ラ行)

リソースサーバ

複数サーバで共有リソースを共用するためだけに使用するサーバです。そのため,サーバとしての機能は持ちません。

リソースサーバを使用しない場合,サーバ単位で共有リソースを制御するのに対し,リソースサーバを使用する場合はサーバグループ単位で共有リソースを制御します。

連動系切り替え

サーバをあらかじめグループ化しておくことで,そのグループ(サーバグループ)内の実行サーバのどれかに障害が発生した場合に,グループ単位で待機サーバに切り替える機能です。HAモニタでは,サーバグループ内でも,サーバ単位に系切り替え時の動作を指定できます。

連動系切り替え待ち状態

サーバ対応の環境設定のgroupオペランドで,no_exchangeを指定した実行サーバにサーバ障害が発生した場合,待機系の待機サーバの系切り替えをいったん待たせます。この状態の待機サーバを連動系切り替え待ち状態であるといいます。連動系切り替え待ち状態の待機サーバは,ユーザの操作待ちになりますが,グループ内のexchange指定の実行サーバにサーバ障害が発生すると,一緒に連動系切り替えをします。