JP1/ServerConductor/Blade Server Manager系 運用ガイド
この節では,N+1コールドスタンバイを利用する前に検討が必要な,サーバモジュールの割り当てや予備系への切り替えについて説明します。
N+1コールドスタンバイを使用する場合,現用系サーバモジュールと予備系サーバモジュールの割り当てを検討する必要があります。現用系サーバのグループおよび予備系サーバのグループをまとめてN+1グループと呼び,N+1グループ単位でサーバモジュールを割り当てます。
サーバモジュールの割り当ては,SMP構成の場合とSMP構成でない場合とで運用方法が異なります。ここでは,SMP構成の場合とSMP構成でない場合に分けて,サーバモジュールの割り当てを説明します。
サーバモジュールがSMP構成の場合,「9.8.1(3) 予備系サーバモジュールの前提条件」記載される条件に加え,次の条件を満たしている必要があります。
また,4way-SMP構成のサーバモジュールのうち,どちらか1つのサーバモジュールを登録する場合,SMP構成を手動で解除してから登録する必要があります。
SMP構成だけで運用する場合のサーバモジュールの構成例を,次の図に示します。
図9-24 SMP構成の場合のサーバモジュール構成例
サーバモジュールがSMP構成でない場合,予備系サーバモジュールは,「9.8.1(3) 予備系サーバモジュールの前提条件」に記載される条件を満たしている必要があります。SMP構成でない場合のサーバモジュールの構成例を,次の図に示します。
図9-25 SMP構成でない場合のサーバモジュール構成例
N+1コールドスタンバイでは,サーバモジュール障害が発生したときに,自動または手動で予備系サーバモジュールに切り替えることができます。次にそれぞれの切り替え契機について説明します。
サーバモジュール障害が発生した場合,障害通知アラートが通知されると,次のどちらかの契機で自動的に予備系サーバモジュールに切り替わります。この契機は,アラートIDごとに設定できます。
なお,切り替えの契機は,切り替え要求アラートのアラートIDごとに設定できます。
各アラートIDの詳細および設定の変更方法については,「9.8.2(3) 自動切り替えの対象となるアラートの設定」を参照してください。
また,自動切り替え発生時,障害が発生した現用系のサーバモジュールの電源を強制電源OFFするか,OSをシャットダウンしてから電源OFFするか,どちらかを選択できます。自動切り替え時の電源OFF方式の変更方法については,「9.8.2(5) 自動切り替え時の現用系の電源OFF」を参照してください。
自動で予備系サーバモジュールに切り替えるためには,[マネージャサービス設定]ダイアログボックスの[N+1設定]タブでの設定が必要です。この設定については,「9.8.3 N+1コールドスタンバイ(ディスクパス切替え方式)の設定」を参照してください。自動切り替えの設定をしない場合は,手動で切り替える設定となります。
手動で予備系サーバモジュールに切り替える場合は,次に示す手順で実行します。
手動切り替えの操作については,「9.9.2 予備系サーバモジュールへの手動切り替えの実行」を参照してください。
また,N+1コールドスタンバイの自動切り替えを設定していても,N+1コールドスタンバイ機能の手動切り替えの実行,現用系への復帰,または予備系の解除を実行できます。現用系への復帰,予備系の解除の詳細については,「9.9.3 現用系サーバモジュールへの復帰と予備登録の解除」を参照してください。
N+1コールドスタンバイ機能を利用する場合,BladeSymphonyに関するハードウェア障害のサーバモジュール系のアラートが,自動切り替えの対象となります。これらのアラートには,アラートごとに,障害が発生してから自動で切り替えるまでの待ち時間が設定されています。これ以外のアラートは,自動切り替えの対象にできません。
アラートの詳細については,マニュアル「JP1 Version 9 JP1/ServerConductor/Blade Server Manager系 メッセージ」を参照してください。
自動切り替え対象アラートは,N+1対象アラート定義ファイル(N1Alert.dat)に定義されています。N1Alert.datの定義内容を編集することで,N+1コールドスタンバイ自動切り替え対象アラートの設定を変更できます。
N1Alert.datは次のフォルダに格納されています。
<ServerConductorのインストール先フォルダ>\Data
N+1対象アラート定義ファイルの記述形式,デフォルトの定義内容,定義例,定義内容を有効にする手順,および注意事項について,次に説明します。
N1Alert.datの記述形式を次に示します。
AlertID,ForcedExeFlag,WaitTime |
AlertID,ForcedExeFlag,およびWaitTimeは,それぞれ半角コンマで区切って指定します。次に各設定項目について説明します。
行の先頭に,半角スペースまたは#が指定されている場合,その行はコメント行と見なされます。コメント行の入力文字の種類に制限はありません。
N1Alert.datに定義されている,各アラートのデフォルト値を次に示します。
表9-17 自動切り替えの対象となるアラートと設定内容のデフォルト値
| アラートID(AlertID) (変更不可) |
実行フラグ(ForcedExeFlag) (変更可) |
待ち時間(WaitTime) (分)(変更可) |
|---|---|---|
| 1417h | 1 | 60 |
| 1451h※1 | 1 | 0 |
| 1453h※1 | 1 | 0 |
| 1462h | 1 | 0 |
| 1463h | 1 | 0 |
| 1464h | 1 | 60 |
| 1470h※2 | 1 | 60 |
| 1483h※3 | 1 | 0 |
| 1484h※3 | 1 | 60 |
| 1491h | 1 | 60 |
| 1492h | 1 | 60 |
| 1493h | 1 | 60 |
| 1494h | 1 | 60 |
| 1496h※4 | 1 | 60 |
| 1497h | 1 | 60 |
| 1499h | 1 | 60 |
| 14A0h | 1 | 0 |
| 14A5h | 1 | 0 |
| 14A8h | 1 | 0 |
| 14AAh | 1 | 0 |
| 14AFh※4 | 1 | 0 |
| 14B0h | 1 | 0 |
| 14B1h | 1 | 60 |
| 14D2h | 1 | 60 |
| 14D5h | 1 | 60 |
自動切り替えの対象となるアラートの設定内容を変更する場合のN1Alert.datの定義例を次に示します。
1417h,0,0 |
#1417h,1,60 |
1462h,1,0 |
1463h,1,60 |
N1Alert.datの設定内容を変更した場合は,次に示すどちらかの操作をしてください。この操作をしないと,変更した内容が有効になりません。
N+1コールドスタンバイの自動切り替えを実施する場合,運用ケースによって必要な設定項目および自動切り替え対象アラートの切り替え待ち時間の見積もり方法が異なります。
自動切り替えに必要な設定,および自動切り替え待ち時間の見積もり方法を,運用ケースごとに,次の表に示します。
表9-18 運用ケース別のN+1コールドスタンバイに必要な設定と自動切り替え対象アラートの自動切り替え待ち時間の見積もり
| 項番 | 障害アラート発生後の運用ケース | N1Alert.datの設定※ | 自動切り替え待ち時間の見積もり |
|---|---|---|---|
| 1 | ダンプを採取してから自動切り替えを実行する | ForcedExeFlag=1 WaitTime=自動切り替え待ち時間 |
障害発生からダンプの採取開始までの時間+ダンプの採取に掛かる時間 |
| 2 | 自動切り替えを手動で中止してからダンプを採取する | ForcedExeFlag=1 WaitTime=自動切り替え待ち時間 |
障害発生から自動切り替えの中止の実行に掛かる時間 |
| 3 | ダンプを採取しないで自動切り替えを実行する | ForcedExeFlag=1 WaitTime=0 |
0分 |
| 4 | 自動切り替えを実行しないでダンプの採取だけを実行する | ForcedExeFlag=0 WaitTime=0 |
0分 |
| 5 | 自動切り替えを実行しないで自動的にシステムの再起動だけを実行する | ForcedExeFlag=0 WaitTime=0 |
0分 |
表に示した各項目について説明します。
障害の発生後,切り替え待ち時間が経過するまでにダンプの採取を完了させます。
障害の発生後,[N+1コールドスタンバイ詳細設定]ウィンドウから手動で自動切り替えを中止してダンプの採取を実施します。ダンプの採取が完了したら手動で復旧処理を実施します。
障害の発生後,即時に切り替えを実施します。
障害の発生後,ダンプの採取だけを実行します。
障害の発生後,自動的にシステムの再起動だけを実行します。この運用ケースはアラートID 0x1470が発生した場合だけ該当します。
自動切り替えが発生したとき,障害が発生した現用系のサーバモジュールの電源OFFの方式を次の中から選択できます。
サーバモジュールの電源OFFの方式は,N1Alert.datで定義されている自動切り替えの対象アラートごとに設定できます。また,設定した内容は,マネージャサービスが管理しているN+1グループの現用系のサーバモジュールすべてに適用されます。N1Alert.datで定義されている自動切り替えの対象アラートについては,「9.8.2(3) 自動切り替えの対象となるアラートの設定」を参照してください。
自動切り替え発生時,障害が発生した現用系のサーバモジュールの電源を強制電源OFFするか,OSをシャットダウンしてから電源OFFするかは,N+1コールドスタンバイ設定ファイル(N1SwitchShutdownSet.ini)に定義されています。N1SwitchShutdownSet.iniの定義内容を編集することで,N+1コールドスタンバイ自動切り替え時の電源OFFの方式を変更できます。
N1SwitchShutdownSet.iniは次のフォルダに格納されています。
<ServerConductorのインストール先フォルダ>\Data
N+1コールドスタンバイ設定ファイルの記述形式,デフォルトの定義内容,定義例,定義内容を有効にする手順,および注意事項について,次に説明します。
N1SwitchShutdownSet.iniの記述形式を次に示します。
[N1ShutdownSetting]
Function={0|1}
Timeout=監視時間
[AlertID]
アラートID={0|1}
:
:
アラートID={0|1}
|
次に各設定項目について説明します。
「=」がない行,および先頭文字が「[」または「#」の行は,コメント行と見なされます。
N1SwitchShutdownSet.iniに定義されているデフォルト値を次に示します。
[N1ShutdownSetting] Function=0 Timeout=5 [AlertID] 1417h=0 1492h=0 1493h=0 1494h=0 1470h=0 1496h=0 1497h=0 1499h=0 14A0h=0 14A5h=0 1453h=0 1451h=0 14A8h=0 1462h=0 14AAh=0 14AFh=0 1464h=0 14B0h=0 14B1h=0 1491h=0 1463h=0 14D2h=0 14D5h=0 1483h=0 1484h=0 1788h=0 1789h=0 |
0x1417アラートによる自動切り替えが発生したとき,OSシャットダウン後に電源OFFを実行する場合のN1SwitchShutdownSet.iniの定義例を次に示します。監視時間は5分とします。
[N1ShutdownSetting]
Function=1
Timeout=5
[AlertID]
1417h=1
:
:
|
N1SwitchShutdownSet.iniの設定内容を変更した場合は,次に示すどちらかの操作をしてください。この操作をしないと,変更した内容が有効になりません。
All Rights Reserved. Copyright (C) 2010, 2014, Hitachi, Ltd.