JP1/Integrated Management - Manager システム構築・運用ガイド
JP1/IM - ManagerはJP1/IM - Manager自身に障害が発生した場合に備えて,トラブル解決の調査資料を採取するツールや,プロセスの異常終了時に自動で再起動する機能などを提供しています。
ここでは,JP1/IM - Managerの障害に備えた設定項目について説明します。
- <この項の構成>
- (1) 障害発生時の資料採取の準備
- (2) プロセス異常終了時の再起動の設定
- (3) プロセス異常検知時のJP1イベントの発行の設定
- (4) ヘルスチェック機能の設定
- (5) 監視オブジェクトDBの自動バックアップ・リカバリー設定
(1) 障害発生時の資料採取の準備
JP1/IM - Managerではトラブル発生時に資料を採取するためのツールをシェルスクリプト(jim_log.sh)として提供しています。このツールは,トラブルの解決の調査資料となる情報を一括して採取するツールです。
JP1/IM - Managerの資料採取ツールで採取できるのは,JP1/IM - ManagerおよびJP1/Baseのトラブルシュート資料です。採取できる資料の詳細は「24.3 トラブル発生時に採取が必要な資料」を参照してください。
- 資料採取ツールについて
- jim_log.shについて
参照先:マニュアル「JP1/Integrated Management - Manager リファレンス jim_log.sh(UNIX限定)」(2. コマンド)
なお,トラブルが発生した場合に調査資料として,コアダンプファイルが必要になることがあります。コアダンプファイルの出力はユーザーの環境設定に依存するため,次に示す設定を確認しておいてください。
(a) コアダンプファイルのサイズ設定
コアダンプファイルの最大サイズは,rootユーザーのコアダンプファイルのサイズ設定(ulimit -c)によって制限されます。JP1/IM - Managerではコアダンプファイルがユーザーの環境設定に依存しないで出力されるよう,jco_startおよびjco_start.clusterスクリプト内で次の設定をしています。
ulimit -c unlimitedこの設定が,ご使用のマシンのセキュリティポリシーに反する場合は,これらのスクリプトの設定を次のようにコメント行にしてください。
# ulimit -c unlimited
- 注意
- コメント行にした場合,JP1/IM - Managerのプロセスで発生したセグメンテーション障害,バス障害やjcogencoreコマンド実行時などのコアダンプファイルの出力契機に,コアダンプが出力されないため,調査が行えないおそれがあります。
(b) コアダンプに関連するカーネルパラメーターの設定(Linux限定)
Linuxのカーネルパラメーター(kernel.core_pattern)で,コアダンプファイルの出力先,およびファイル名をデフォルトの設定から変更している場合,資料採取ツールの実行時にコアダンプファイルを採取できないときがあります。このため,Linuxのカーネルパラメーター(kernel.core_pattern)の設定は変更しないことをお勧めします。
資料採取ツールは,次に示すデフォルトの出力先ディレクトリにあるファイル名がcoreから始まるファイルを採取します。
- 物理ホストの場合:/var/opt/jp1cons/log/
- 論理ホストの場合:共有ディレクトリ/jp1cons/log/
kernel.core_patternの設定を変更している場合には,資料採取ツールの実行前に次のことを実施しておく必要があります。
- コアダンプファイルの出力先ディレクトリを変更している場合
コアダンプファイルをデフォルトの出力先ディレクトリにコピーしておく。
- コアダンプファイルのファイル名を変更している場合
コアダンプファイルのファイル名をcoreから始まるファイル名にリネームしておく。
(2) プロセス異常終了時の再起動の設定
- プロセス再起動の定義
プロセス再起動が有効になるよう,次の拡張起動プロセス定義ファイルを編集します。
/etc/opt/jp1cons/conf/jp1co_service_0700.conf
「再起動可否」パラメーターは「|」で区切られた4番目の値で,0(再起動しない:デフォルト)または1(再起動する)を設定します。
- 定義内容の反映
JP1/IM - Managerが稼働している場合は,プロセス再起動の設定が有効になるよう,JP1/IM - Managerのリロードコマンドを実行します。
/opt/jp1cons/bin/jco_spmd_reload
- プロセス再起動の定義について
- 拡張起動プロセス定義ファイル(jp1co_service_0700.conf)について
参照先:マニュアル「JP1/Integrated Management - Manager リファレンス 拡張起動プロセス定義ファイル(jp1co_service_0700.conf)」(3. 定義ファイル)
(3) プロセス異常検知時のJP1イベントの発行の設定
- JP1イベント発行の設定をする。
次のIMパラメーター定義ファイルを編集します。
このファイルの「SEND_PROCESS_TERMINATED_ABNORMALLY_EVENT」と「SEND_PROCESS_RESTART_EVENT」がJP1イベント発行の設定パラメーターです。JP1イベントを発行するには,値を「dword:1」に変更します。
/etc/opt/jp1cons/conf/jp1co_param_V7.conf
- jbssetcnfコマンドを実行して,定義内容を反映する。
/opt/jp1base/bin/jbssetcnf /etc/opt/jp1cons/conf/jp1co_param_V7.conf- JP1/BaseおよびJP1/Baseを前提とする製品を再起動する。
再起動後に設定内容が反映されます。
- JP1イベント発行の設定について
- IMパラメーター定義ファイル(jp1co_param_V7.conf)について
参照先:マニュアル「JP1/Integrated Management - Manager リファレンス IMパラメーター定義ファイル(jp1co_param_V7.conf)」(3. 定義ファイル)
(4) ヘルスチェック機能の設定
ヘルスチェック機能を使ってJP1/IM - Managerプロセスのハングアップを検知したい場合に設定します。
- ヘルスチェック定義ファイル(jcohc.conf)を開き,パラメーター設定をする。
ヘルスチェック機能を有効にするため,ENABLE=trueにします。
また,ハングアップ検知時にJP1イベントを発行する場合にはEVENT=trueに,通知コマンドを実行する場合にはCOMMAND=実行するコマンドを指定してください。
- 通知コマンドの設定をした場合は,jcohctestコマンドを実行して動作確認する。
jcohctestコマンドを実行して,正しくCOMMANDで指定したコマンドが実行されるか確認します。正しく動作しなかった場合は指定を見直してください。
- jco_spmd_reloadコマンドでJP1/IM - Managerをリロードする。または,JP1/IM - Managerを再起動する。
- ヘルスチェック機能の設定について
- ヘルスチェック定義ファイル(jcohc.conf)について
参照先:マニュアル「JP1/Integrated Management - Manager リファレンス ヘルスチェック定義ファイル(jcohc.conf)」(3. 定義ファイル)
- jcohctestコマンドについて
参照先:マニュアル「JP1/Integrated Management - Manager リファレンス jcohctest」(2. コマンド)
(5) 監視オブジェクトDBの自動バックアップ・リカバリー設定
統合スコープの機能を使用する場合に設定します。
監視ツリーの更新中に,OSがシャットダウンしたり,クラスタ運用時にフェールオーバーしたりすると,監視オブジェクトDBが破損するおそれがあります。このため,監視ツリーの更新時に監視オブジェクトDBを自動でバックアップ・リカバリーするよう設定します。
新規インストールの場合は有効,旧バージョンのJP1/IM - ManagerまたはJP1/IM - Central Scopeで設定を無効にしていた場合は無効となっています。運用に合わせて,設定を変更してください。
- JP1/IM - Managerを停止する。
- 次のファイルを引数にjbssetcnfコマンドを実行する。
監視オブジェクトDBの自動バックアップ・リカバリー機能を有効にする:auto_dbbackup_on.conf
監視オブジェクトDBの自動バックアップ・リカバリー機能を無効にする:auto_dbbackup_off.conf
jbssetcnfコマンドを実行すると,JP1共通定義情報に設定内容が反映されます。
jbssetcnfコマンドについては,マニュアル「JP1/Base 運用ガイド」を参照してください。
- ファイルの設定内容について
- ファイルの設定内容については,マニュアル「JP1/Integrated Management - Manager リファレンス 監視オブジェクトDBの自動バックアップ・リカバリー設定ファイル(auto_dbbackup_xxx.conf)」(3. 定義ファイル)を参照してください。
- JP1/IM - Managerを起動する。
All Rights Reserved. Copyright (C) 2006, 2008, Hitachi, Ltd.