Hitachi HA Toolkit
サーバ(HiRDB)の要因で実行サーバを起動できなかった場合,サーバからHA Toolkit Exに実行サーバの起動失敗が通知されます。HA Toolkit Exは通知を受け取った時点で実行サーバを起動失敗と判断します。このとき,クラスタソフトの設定によって,系切り替えを実施します。
サーバのメッセージによって,起動に失敗した原因を調査してください。
HA Toolkit Exでは,実行サーバが一定の時間内に起動完了するかを監視できます。
定義内容の不正,サーバ起動コマンドの不正,リソース不足などの理由で,一定の時間内にサーバが起動しなかった場合,HA Toolkit Exはサーバの起動失敗と判断します。
実行サーバの起動タイムアウト検知時の動作および対処は,OSによって異なります。OSごとのタイムアウト検知時の動作および対処を次に示します。
HiRDBの影響分散スタンバイレス型系切り替えでは,一つの系に掛かる負担を分散するために,HiRDBが一つの系で起動できる実行サーバの数を決めます。このため,実行サーバが設定した数だけ起動した時点で,同じ系にある待機サーバは実行サーバに切り替われない状態,つまり未起動状態になります。
クラスタソフトによって系切り替えが実行されるか,またはクラスタソフトのコマンドによってサービスグループをオンライン化したときに,HA Toolkit Exが待機サーバの未起動を検知すると,サービスプロセスを起動失敗にします。クラスタソフトに,ほかの系に系切り替えさせます。これによって,タイムアウト検知を待ったり,障害が発生した実行サーバの再起動を待ったりする必要がなくなり,実行サーバの起動に時間が掛かりません。
HiRDBの影響分散スタンバイレス型系切り替えでは,HA Toolkit Exの定義ファイル(servers)のswitch_nosbyオペランドにactfailを指定して,待機サーバが起動していない系では実行サーバが起動に失敗する設定にしてください。
HA Toolkit Exが待機サーバの未起動を判断し,サービスプロセスを起動失敗させるのは,次の場合です。
待機サーバが未起動の系でのサービスプロセスの起動失敗による,待機サーバが未起動の系での系切り替えの概要を,次に示します。
図4-1 待機サーバが未起動の系での系切り替えの概要(影響分散スタンバイレス型)
前述の図では,HiRDBで一つの系で起動できる実行サーバの数を二つに設定しています。そのため,実行サーバがすでに二つ起動している系3では,待機サーバが未起動状態になっています。待機サーバが起動していない系では実行サーバを起動できないので,系1で障害が発生して実行サーバ二つの系切り替えをする場合でも,系3に切り替えることはできません。そこでクラスタソフトは,系3で実行サーバの起動に失敗したと判断し,実行サーバの起動数が設定よりも少ない系2に切り替えます。
All Rights Reserved. Copyright (C) 2002, 2010, Hitachi, Ltd.