JP1/ServerConductor/Blade Server Manager系 運用ガイド
この節では,N+Mコールドスタンバイ(WWN引継ぎ方式/iSCSI設定引継ぎ方式)を利用する前に検討が必要な,サーバモジュールの割り当てや予備系への切り替えについて説明します。
N+Mコールドスタンバイでは,どのサーバモジュールに障害が発生したらどの予備系サーバモジュールに切り替えるかを設定しておく必要があります。
現用系サーバモジュールと割り当てる予備系サーバモジュールのグループをN+1グループといいます。N+Mコールドスタンバイを利用する際は,N+1グループを作成し,グループ名を付けておきます。
N+Mコールドスタンバイは,1つのN+1グループに対する予備プールに,複数の予備系サーバモジュールを登録できます。複数の予備系サーバモジュールを準備することで,N+1コールドスタンバイよりも,現用系サーバモジュールの障害に対する信頼性,可用性を高められます。
N+Mコールドスタンバイ(WWN引継ぎ方式/iSCSI設定引継ぎ方式)の構成例を次の図に示します。
図9-13 N+Mコールドスタンバイ(WWN引継ぎ方式/iSCSI設定引継ぎ方式)の構成例
構成例に示すように,4台の現用系サーバモジュールに対して2台の予備系サーバモジュールを準備して,複数の現用系サーバモジュールの障害に備えることができます。
N+1グループに現用系サーバモジュールを登録したあとは,随時,予備プールへの予備系サーバモジュールの登録ができます。したがって,現用系サーバモジュールの障害によって,予備プールに準備される予備系サーバモジュールが不足した場合,不足したあとで予備プールにサーバモジュールを追加できます。これによって,N+1グループの現用系サーバモジュールの構成を変更しないで,ほかの現用系サーバモジュールの障害に対応できます。
N+Mコールドスタンバイは,SMPで構成された現用系ホストに対しても適用できます。SMP構成時にN+Mコールドスタンバイ(WWN引継ぎ方式/iSCSI設定引継ぎ方式)を適用したときの構成例を,次の図に示します。
図9-14 N+Mコールドスタンバイの構成例(WWN引継ぎ方式/iSCSI設定引継ぎ方式)(SMP構成時)
構成例に示したように,SMP構成内で障害が発生したときに,同じ構成を持つ予備系サーバモジュールに切り替えられます。
予備系サーバモジュールを割り当てるときは,現用系サーバモジュールと同じ仕様のサーバモジュールを使用する必要があります。また,切り替え後のパーティションの構成を意識して,連続した構成となるように予備系サーバモジュールを割り当てておく必要があります。
N+Mコールドスタンバイは,N+1コールドスタンバイと同様に,手動または自動で予備系サーバモジュールに切り替えることができます。
手動で切り替える場合,予備系サーバモジュールの切り替え先を指定できます。自動で切り替える場合,現用系サーバモジュールにハードウェア障害が発生した契機で,予備系サーバモジュールに切り替えられます。ハードウェア障害の種類によって,即時に切り替える場合と一定時間後に切り替える場合があります。自動で切り替える場合の注意事項については,「9.8.2(2) 予備系への切り替えの方法(N+1コールドスタンバイ)」を参照してください。
現用系サーバモジュールに障害が発生し,一定時間後に予備系サーバモジュールに切り替える間に,別の現用系サーバモジュールで強制電源切断を伴う障害が発生したときは,先に障害が発生した現用系サーバモジュールに予備系サーバモジュールが割り当てられます。あとで障害が発生した現用系サーバモジュールは,予備プールに空きの予備系サーバモジュールがある場合に割り当てられます。このとき,予備系サーバモジュールの選択順序に従って割り当てられます。予備系サーバモジュールの選択順序については,「9.6.2(3)(c) 予備系サーバモジュールの選択順序」を参照してください。
N+Mコールドスタンバイの現用系サーバモジュールの切り替えを,手動で行う場合と自動で行う場合のそれぞれの切り替え先について説明します。また,予備系サーバモジュールに切り替えるときの選択順序についても説明します。
手動でサーバモジュールを切り替える場合,予備プール中の切り替え可能な予備系サーバモジュールから選択して切り替えることができます。予備系サーバモジュールを選択しない場合は,切り替え可能な予備系サーバモジュールの選択順序に従ってサーバモジュールが選択されます。切り替え可能な予備系サーバモジュールがない場合は,手動切り替えは実行できません。
切り替え可能な予備系サーバモジュールとは,「コールドスタンバイ中」「コールドスタンバイ失敗」状態の予備系サーバモジュールを指します。「コールドスタンバイ切り替え中」「コールドスタンバイ実行」「コールドスタンバイ警告」「サーバモジュール障害」状態の予備系サーバモジュールは,切り替え対象になりません。
また,切り替えに失敗した場合は,予備プールに切り替え可能な予備系サーバモジュールが残っていても,残りのサーバモジュールに対して切り替えは実行されません。
自動でサーバモジュールを切り替える場合,選択順序に従って予備プール中の予備系サーバモジュールを選択して切り替えます。切り替え可能な予備系サーバモジュールが見つからなかった場合は,警告アラート(アラートID:0x3722)がコンソールサービスに通知され,自動切り替えは実行されません。このように,予備プールに予備系サーバモジュールが不足している場合は,予備プールにサーバモジュールを追加したあとに,障害の発生した現用系サーバモジュールに対して手動切り替えを実行できます。
自動切り替えで,切り替え可能な予備系サーバモジュールとは,手動切り替えで切り替え可能なサーバモジュールと同様に,「コールドスタンバイ中」「コールドスタンバイ失敗」状態の予備系サーバモジュールを指します。
また,切り替えに失敗した場合は,予備プールに切り替え可能な予備系サーバモジュールが残っていても,残りのサーバモジュールに対して切り替えは実行されません。
予備系サーバモジュールは,サーバシャーシ定期診断の結果,通信状態が不安定でないと診断されたサーバシャーシのうち,アルファベット順で先行するシャーシ名を持つシャーシの中で,小さいスロット番号を持つサーバモジュールから順に選択されます。
N+1コールドスタンバイ機能を利用する場合,BladeSymphonyに関するハードウェア障害のサーバモジュール系のアラートが,自動切り替えの対象となります。これらのアラートには,アラートごとに,障害が発生してから自動で切り替えるまでの待ち時間が設定されています。これ以外のアラートは,自動切り替えの対象にできません。
アラートの詳細については,マニュアル「JP1 Version 9 JP1/ServerConductor/Blade Server Manager系 メッセージ」を参照してください。
自動切り替え対象アラートは,N+1対象アラート定義ファイル(N1Alert.dat)に定義されています。N1Alert.datの定義内容を編集することで,N+1コールドスタンバイ自動切り替え対象アラートの設定を変更できます。
N1Alert.datは次のフォルダに格納されています。
<ServerConductorのインストール先フォルダ>\Data
N+1対象アラート定義ファイルの記述形式,デフォルトの定義内容,定義例,定義内容を有効にする手順,および注意事項について,次に説明します。
N1Alert.datの記述形式を次に示します。
AlertID,ForcedExeFlag,WaitTime |
AlertID,ForcedExeFlag,およびWaitTimeは,それぞれ半角コンマで区切って指定します。次に各設定項目について説明します。
行の先頭に,半角スペースまたは#が指定されている場合,その行はコメント行と見なされます。コメント行の入力文字の種類に制限はありません。
N1Alert.datに定義されている,各アラートのデフォルト値を次に示します。
表9-6 自動切り替えの対象となるアラートと設定内容のデフォルト値
| アラートID(AlertID) (変更不可) |
実行フラグ(ForcedExeFlag) (変更可) |
待ち時間(WaitTime) (分)(変更可) |
|---|---|---|
| 1417h | 1 | 60 |
| 1451h※1 | 1 | 0 |
| 1453h※1 | 1 | 0 |
| 1462h | 1 | 0 |
| 1463h | 1 | 0 |
| 1464h | 1 | 60 |
| 146Eh | 1 | 0 |
| 1470h※2※3※5 | 1 | 60 |
| 1483h※4※5 | 1 | 0 |
| 1484h※4※5 | 1 | 60 |
| 148Eh※6 | 1 | 0 |
| 1491h | 1 | 60 |
| 1492h | 1 | 60 |
| 1493h | 1 | 60 |
| 1494h | 1 | 60 |
| 1496h※6 | 1 | 60 |
| 1497h | 1 | 60 |
| 1499h | 1 | 60 |
| 14A0h | 1 | 0 |
| 14A5h | 1 | 0 |
| 14A8h | 1 | 0 |
| 14AAh | 1 | 0 |
| 14AFh※6 | 1 | 0 |
| 14B0h | 1 | 0 |
| 14B1h | 1 | 60 |
| 14D2h | 1 | 60 |
| 14D5h | 1 | 60 |
| 1788h※5※7 | 1 | 0 |
| 1789h※5※7 | 1 | 60 |
なお,バージョン08-60未満のバージョンからバージョンアップする場合は,バージョンアップしたあとに,N1Alert.datに「1788h,1,0」,「1789h,1,60」,「146Eh,1,0」,および「148Eh,1,0」の4行を追加してください。また,バージョン08-60以降かつ09-54未満のバージョンからバージョンアップする場合は,バージョンアップしたあとに,N1Alert.datに「146Eh,1,0」および「148Eh,1,0」の2行を追加してください。
自動切り替えの対象となるアラートの設定内容を変更する場合のN1Alert.datの定義例を次に示します。
1417h,0,0 |
#1417h,1,60 |
1462h,1,0 |
1463h,1,60 |
N1Alert.datの設定内容を変更した場合は,次に示すどちらかの操作をしてください。この操作をしないと,変更した内容が有効になりません。
バージョン08-60未満のバージョンからバージョンアップする場合は,バージョンアップしたあと,N1Alert.datに,1788h,1789h,146Eh,および148Ehのアラートの設定を追加してください。また,バージョン08-60以降かつ09-54未満のバージョンからバージョンアップする場合は,バージョンアップしたあと,N1Alert.datに,146Ehおよび148Ehのアラートの設定を追加してください。
N+Mコールドスタンバイ(WWN引継ぎ方式/iSCSI設定引継ぎ方式)の自動切り替えを実施する場合,運用ケースによって必要な設定項目および自動切り替え対象アラートの切り替え待ち時間の見積もり方法が異なります。
自動切り替えに必要な設定,および自動切り替え待ち時間の見積もり方法を,運用ケースごとに,次の表に示します。
表9-7 運用ケース別のN+Mコールドスタンバイ(WWN引継ぎ方式/iSCSI設定引継ぎ方式)に必要な設定と自動切り替え対象アラートの自動切り替え待ち時間の見積もり
| 項番 | 障害アラート発生後の運用ケース | 必要な設定 | 自動切り替え待ち時間の見積もり | |||
|---|---|---|---|---|---|---|
| N1Alert.datの設定※1 | 自動切り替え中止の設定※2 | 障害監視の設定※3 | ||||
| Windows | Linux | |||||
| 1 | ダンプを採取してから自動切り替えを実行する | ForcedExeFlag=1 WaitTime=自動切り替え待ち時間 |
しない | 何もしない | 0 | 障害発生からダンプの採取開始までの時間+ダンプの採取に掛かる時間 |
| 2 | ダンプを採取してから自動切り替えを実行する (現用系ホストでエージェントサービスが起動した場合は自動切り替えを中止する) |
ForcedExeFlag=1 WaitTime=自動切り替え待ち時間 |
する | 何もしない | 0 | 障害発生からダンプの採取開始までの時間+ダンプの採取に掛かる時間+ダンプ採取の完了後に現用系ホストでシステムを再起動して,[ホスト管理]ウィンドウでアイコンが活性化するまでの時間 |
| 3 | 自動切り替えを手動で中止してからダンプを採取する | ForcedExeFlag=1 WaitTime=自動切り替え待ち時間 |
しない | 何もしない | 0 | 障害発生から自動切り替えの中止の実行に掛かる時間 |
| 4 | ダンプを採取しないで自動切り替えを実行する | ForcedExeFlag=1 WaitTime=0 |
しない | 何もしない | 0 | 0分 |
| 5 | ダンプを採取しないで自動切り替えを実行する (現用系ホストでエージェントサービスが起動した場合は自動切り替えを中止する) |
ForcedExeFlag=1 WaitTime=自動切り替え待ち時間 |
する |
|
|
現用系ホストでシステムを再起動して,[ホスト管理]ウィンドウでアイコンが活性化するまでの時間 |
| 6 | 自動切り替えを実行しないでダンプの採取だけを実行する | ForcedExeFlag=0 WaitTime=0 |
しない | 何もしない | 0 | 0分 |
| 7 | 自動切り替えを実行しないで自動的にシステムの再起動だけを実行する | ForcedExeFlag=0 WaitTime=0 |
しない | リセットまたは電源OFF→電源ON | 1または3 | 0分 |
表に示した各項目について説明します。
障害の発生後,切り替え待ち時間が経過するまでにダンプの採取を完了させます。
障害の発生後,切り替え待ち時間が経過するまでにダンプの採取を完了させます。また,ダンプの採取終了後にシステムを再起動して現用系ホストのエージェントサービスが起動した場合は,自動的に切り替えを中止します。この運用ケースはアラートID 0x1470が発生した場合だけ該当します。
障害の発生後,[N+1コールドスタンバイ詳細設定]ウィンドウから手動で自動切り替えを中止してダンプの採取を実施します。ダンプの採取が完了したら手動で復旧処理を実施します。
障害の発生後,即時に切り替えを実施します。
障害発生後に切り替え待ち時間が経過したあと,切り替えを開始します。切り替え待ち時間中に現用系ホストのエージェントサービスが起動した場合は,自動的に切り替えを中止します。この運用ケースはアラートID 0x1470が発生した場合だけ該当します。
障害の発生後,ダンプの採取だけを実行します。
障害の発生後,自動的にシステムの再起動だけを実行します。この運用ケースはアラートID 0x1470が発生した場合だけ該当します。
自動切り替えが発生したとき,障害が発生した現用系のサーバモジュールの電源OFFの方式を次の中から選択できます。
サーバモジュールの電源OFFの方式は,N1Alert.datで定義されている自動切り替えの対象アラートごとに設定できます。また,設定した内容は,マネージャサービスが管理しているN+1グループの現用系のサーバモジュールすべてに適用されます。N1Alert.datで定義されている自動切り替えの対象アラートについては,「9.6.2(4) 自動切り替えの対象となるアラートの設定」を参照してください。
自動切り替え発生時,障害が発生した現用系のサーバモジュールの電源を強制電源OFFするか,OSをシャットダウンしてから電源OFFするかは,N+1コールドスタンバイ設定ファイル(N1SwitchShutdownSet.ini)に定義されています。N1SwitchShutdownSet.iniの定義内容を編集することで,N+1コールドスタンバイ自動切り替え時の電源OFFの方式を変更できます。
N1SwitchShutdownSet.iniは次のフォルダに格納されています。
<ServerConductorのインストール先フォルダ>\Data
N+1コールドスタンバイ設定ファイルの記述形式,デフォルトの定義内容,定義例,定義内容を有効にする手順,および注意事項について,次に説明します。
N1SwitchShutdownSet.iniの記述形式を次に示します。
[N1ShutdownSetting]
Function={0|1}
Timeout=監視時間
[AlertID]
アラートID={0|1}
:
:
アラートID={0|1}
|
次に各設定項目について説明します。
「=」がない行,および先頭文字が「[」または「#」の行は,コメント行と見なされます。
N1SwitchShutdownSet.iniに定義されているデフォルト値を次に示します。
[N1ShutdownSetting] Function=0 Timeout=5 [AlertID] 1417h=0 1492h=0 1493h=0 1494h=0 1470h=0 1496h=0 1497h=0 1499h=0 14A0h=0 14A5h=0 1453h=0 1451h=0 14A8h=0 1462h=0 14AAh=0 14AFh=0 1464h=0 14B0h=0 14B1h=0 1491h=0 1463h=0 14D2h=0 14D5h=0 1483h=0 1484h=0 1788h=0 1789h=0 146Eh=0 148Eh=0 |
なお,バージョン08-60未満のバージョンからバージョンアップする場合は,バージョンアップしたあとに,N1SwitchShutdownSet.iniに「1788h=0」,「1789h=0」,「146Eh=0」,および「148Eh=0」の4行を追加してください。また,バージョン08-60以降かつ09-54未満のバージョンからバージョンアップする場合は,バージョンアップしたあとに,N1SwitchShutdownSet.iniに「146Eh=0」および「148Eh=0」の2行を追加してください。
0x1417アラートによる自動切り替えが発生したとき,OSシャットダウン後に電源OFFを実行する場合のN1SwitchShutdownSet.iniの定義例を次に示します。監視時間は5分とします。
[N1ShutdownSetting]
Function=1
Timeout=5
[AlertID]
1417h=1
:
:
|
N1SwitchShutdownSet.iniの設定内容を変更した場合は,次に示すどちらかの操作をしてください。この操作をしないと,変更した内容が有効になりません。
バージョン08-60未満のバージョンからバージョンアップする場合は,バージョンアップしたあと,N1SwitchShutdownSet.iniに,1788h,1789h,146Eh,および148Ehのアラートの設定を追加してください。また,バージョン08-60以降かつ09-54未満のバージョンからバージョンアップする場合は,バージョンアップしたあと,N1SwitchShutdownSet.iniに,146Ehおよび148Ehのアラートの設定を追加してください。
All Rights Reserved. Copyright (C) 2010, 2014, Hitachi, Ltd.