Hitachi

JP1 Version 12 JP1/SNMP System Observer


9.2.3 運用時の障害の対処方法

運用時に想定される障害と対処方法について説明します。

〈この項の構成〉

(1) リソースブラウザウィンドウで定期照会結果またはサマリデータが参照できない

表示されたメッセージの内容を確認してください。

エラーがタイムアウトの場合

SNMPエージェントが正しく動作しているか確認してください。また,SNMP定義ファイル(ssosnmp.conf)のGetコミュニティ名と,SNMPエージェントのGetコミュニティ名が合っているか確認してください。

エラーがタイムアウト以外の場合

SNMPエージェントが起動しているか確認してください。

(2) リソース収集条件設定ウィンドウまたはリソース収集データ参照ウィンドウが突然終了した

(3) 収集データが保存されない

リソース収集データ参照ウィンドウで収集状態を確認してください。

待機中の場合

収集開始時刻,または収集時間帯の収集開始時刻に達しているか確認してください。

延期中の場合

SNMPエージェントから「noSuchName」,「genErr」,「timeOut」のSNMPエラーが応答されています。

  • ssocolmngデーモンプロセスとssocollectdデーモンプロセスのログファイル(デーモンプロセス名.log)の内容を確認してください。

  • SNMPエージェントとのネットワークの接続性を確認してください。

  • SNMPエージェントが起動しているか確認してください。

  • SNMP定義ファイル(ssosnmp.conf)に,SNMPエージェントのコミュニティ名が正しく設定されているか確認してください。

収集完了の場合

収集が完了しています。収集を開始してください。

収集不可の場合

SNMPエージェントから「noSuchName」,「genErr」,「timeOut」以外のSNMPエラーが応答されました。または,SNMPエージェントが収集対象のリソースをサポートしていません。

  • ssocolmngデーモンプロセスとssocollectdデーモンプロセスのログファイル(デーモンプロセス名.log)の内容を確認してください。

  • 監視サーバのSNMPエージェントが収集対象のリソースをサポートしているか確認してください。

(4) プロセス監視条件設定ウィンドウまたはプロセスモニタウィンドウが突然終了した

(5) プロセス・サービス監視で監視アプリケーションの状態が認識不能となる

(6) ユーザリソースの収集を開始すると,収集状態が「延期中」になって収集されない

(7) サービス監視でアプリケーションの状態が認識不能となる

プロセスモニタのサービス監視項目が認識不能となっている場合は,監視しているサービス名が正しいかどうか確認してください。サービス名はAPMのapmservlistコマンドで確認できます。

(8) リソースの収集を開始すると,収集状態が延期中になり収集されない

(9) SSOのGUIが起動しない,またはフリーズする

Linuxの場合,日本語入力システムに対応するプロセスが正常に起動しているか確認してください。日本語入力システムに必要なプロセスが起動していないとGUIが正常に起動しなくなる場合があります。

(10) レポート設定ウィンドウが起動しない

(11) レポート設定ウィンドウがssorptdデーモンプロセスに接続できない

(12) レポートが作成されない

(13) リソース収集機能に関連するGUIまたはコマンドがssocolmngデーモンプロセスに接続できない

ssostatusコマンドで表示されるssocolmngデーモンプロセスの状態が「RUNNING」または「DEGENERATING」になっていることを確認してください。

収集対象サーバのホスト名称解決ができない,または遅延する環境で,ssocolmngデーモンプロセスの起動時にssostatusコマンドで表示される状態が「RUNNING*」または「DEGENERATING*」となっている間は,リソース収集機能に関連するGUIおよびコマンドによる操作を受け付けません。そのため,ssostatusコマンドの表示結果が「RUNNING」または「DEGENERATING」と表示されるまで,次に示す操作はしないでください。

(14) NNMiと連携できない

(15) プロセス・サービス監視ができない

(16) カテゴリ名「SSO-Ex」の収集を開始すると,収集状態が延期中になり収集されない

(17) 上記以外のエラー

障害が発生した場合は,次に示す資料を可能な限り障害発生直後に採取してください。

障害発生経緯

障害発生経緯に関する下記の情報を問い合わせ先にご提供ください。

  1. 発生日時(可能な限り,時:分:秒までの詳細日時)

  2. 実施した操作

  3. 発生した現象の内容

  4. 再現性(例:上記操作で毎回発生)

環境構成

問題に関連する監視マネージャおよび監視サーバ双方に関する下記情報を採取してください。

  1. OSおよびそのバージョン,適用パッチ,Service Packなど

  2. インタフェース数と各IPアドレス

  3. クラスタソフトウェアがある場合,そのネットワーク構成情報

  4. SSOと関連JP1製品の構成,およびそれぞれのバージョン(例:09-00-01)

  5. 監視マネージャ−監視サーバ間のNATおよびフィルタリング設定の有無

Linuxの場合の情報採取

表9-1に示す情報を,jp1ssolog.shコマンドおよび手動で採取してください。

jp1ssolog.shコマンドの文法の詳細については,「6. コマンド jp1ssolog.sh(Linux限定)」を参照してください。なお,下記のどれかの現象が発生した場合は,-colオプションを指定してコマンドを実行してください。

リソース収集データ参照ウィンドウ操作時に次の現象が発生した場合
  • 収集データ一覧の表示内容が不正である。

  • 収集データ詳細ウィンドウからの[収集期間一覧],または[インスタンス一覧]の表示内容が不正である。

  • リスト表示ウィンドウに表示されるデータ値が不正である。

ssoextractlogコマンド実行時に次の現象が発生した場合
  • -listオプションを指定して実行したとき,収集データベースの一覧の表示内容が不正である。

  • -textオプションを指定して実行したとき,収集データのテキスト出力結果の収集データ値が不正である。

  • 該当するデータベースがあるのに,標準エラー出力に「該当するデータベースがありません」と出力されて失敗する。

レポート設定ウィンドウ操作時に次の現象が発生した場合
  • インスタンス一覧の表示内容が不正である。

  • レポート作成結果の表,またはグラフ内のデータ値が不正である。

  • インスタンス一覧表示,またはレポート作成時に,レポート対象となる収集データがあるのに,「対象となる収集データが存在しません」のメッセージがポップアップ表示されて失敗する。

ssodemandrptコマンド実行時に次の現象が発生した場合
  • レポート作成結果の表,またはグラフ内のデータ値が不正である。

  • レポート対象となる収集データがあるのに,標準エラー出力に「対象となる収集データが存在しません」が出力されて失敗する。

表9‒1 障害時に採取する情報の一覧(Linux)

分類

採取方法

取得資料

基本情報

手動

環境構成図(OS,IPアドレス,インタフェース数,各端末の製品構成とバージョン)

障害発生経緯のメモ(詳細な発生日時,OS,ホスト名,IPアドレス,実施した操作,どのような現象になったのか)

OSの情報

jp1ssolog.sh

採取ファイル

/etc/hosts

/etc/nsswitch.conf(存在すれば)

/etc/services

/etc/rc.log(存在すれば)

syslogファイル※1(存在すれば)

/var/log/messages*

/core(存在すれば)

/etc/.hitachi/pplistd/pplistd

/etc/.hitachi/.hitachi.log*

/etc/.hitachi/.install.log*

/etc/.hitachi/.uninstall.log*(存在すれば)

コマンド実行結果

date

OSのバージョン情報

uname -a

ps -elf(時間差で2回採取)

hostname

netstat -a

netstat -an

netstat -rn

netstat -i

set

env

空きディスク情報

df -k

適用パッチリスト

rpm -qa -last

iptables -L -n

ip6tables -L -n

SSOの情報

jp1ssolog.sh

採取ファイル

/var/opt/CM2/SSO/log配下

/etc/opt/CM2/SSO/conf配下

/etc/opt/CM2/SSO/report配下

/opt/CM2/SSO/bin/.ssostart(存在すれば)

/opt/CM2/SSO/uCPSB/CC/web/containers/SSOConsole/logs

/opt/CM2/SSO/uCPSB/CC/web/containers/SSOConsole/usrconf

/opt/CM2/SSO/uCPSB/CC/web/containers/SSOConsole/work

/opt/CM2/SSO/uCPSB/httpsd/conf

/opt/CM2/SSO/uCPSB/httpsd/logs

/opt/CM2/SSO/uCPSB/CC/client/logs/system/ejbcl/CJW

/opt/CM2/SSO/uCPSB/CC/web/redirector/logs

/var/opt/CM2/SSO/auditlog配下

/var/opt/CM2/SSO/tmp/ssoclustersetup.log(存在すれば)

/opt/CM2/SSO/uCPSB/etc/.hitachi

/opt/CM2/SSO/uCPSB/spkmanage.log(存在すれば)

コマンド実行結果

ssostatus

ssoapcom -X 4095※2

ssocollectd -X 4095※2

ssocolmng -X 4095※2

ssorprtd -X 4095※2

ssotrapd -X 4095※2

ssomapstatus -show -all

ssoapcom -F※2

ssocollectd -F※2

ssocolmng -F※2

インストールディレクトリ配下リスト

ls -lRaL /opt/CM2/SSO

ls -lRaL /etc/opt/CM2/SSO

ls -lRaL /var/opt/CM2/SSO

jp1ssolog.sh

-colオプション指定時

/var/opt/CM2/SSO/databases/Coll配下

jp1ssolog.sh

エージェントのIPアドレスまたはホスト名指定時

指定エージェントごとの ping -n 5 の結果※3

NNMiの情報

手動

コマンド実行結果

ovstatus

注※1

syslogファイルの出力先がデフォルトではない場合,手動でsyslogファイルを採取してください。

注※2

対応する各デーモンプロセスが未起動のときは採取できません。

注※3

OSがLinuxの場合で,pingコマンドの戻り値が0以外のとき,ping6コマンドを実行します。

Windowsの場合の情報採取

表9-2に示す情報を,jp1ssolog.batコマンドおよび手動で採取してください。

jp1ssolog.batコマンドの文法の詳細については,「6. コマンド jp1ssolog.bat(Windows限定)」を参照してください。なお,下記のどれかの現象が発生した場合は,-colオプションを指定してコマンドを実行してください。

リソース収集データ参照ウィンドウ操作時に次の現象が発生した場合
  • 収集データ一覧の表示内容が不正である。

  • 収集データ詳細ウィンドウからの[収集期間一覧],または[インスタンス一覧]の表示内容が不正である。

  • リスト表示ウィンドウに表示されるデータ値が不正である。

ssoextractlogコマンド実行時に次の現象が発生した場合
  • -listオプションを指定して実行したとき,収集データベースの一覧の表示内容が不正である。

  • -textオプションを指定して実行したとき,収集データのテキスト出力結果の収集データ値が不正である。

  • 該当するデータベースがあるのに,標準エラー出力に「該当するデータベースがありません」と出力されて失敗する。

レポート設定ウィンドウ操作時に次の現象が発生した場合
  • インスタンス一覧の表示内容が不正である。

  • レポート作成結果の表,またはグラフ内のデータ値が不正である。

  • インスタンス一覧表示,またはレポート作成時に,レポート対象となる収集データがあるのに,「対象となる収集データが存在しません」のメッセージがポップアップ表示されて失敗する。

ssodemandrptコマンド実行時に次の現象が発生した場合
  • レポート作成結果の表,またはグラフ内のデータ値が不正である。

  • レポート対象となる収集データがあるのに,標準エラー出力に「対象となる収集データが存在しません」が出力されて失敗する。

表9‒2 障害時に採取する情報の一覧(Windows)

分類

採取方法

取得資料

基本情報

手動

環境構成図(OS,IPアドレス,インタフェース数,各端末の製品構成とバージョン)

障害発生経緯のメモ(詳細な発生日時,OS,ホスト名,IPアドレス,実施した操作,どのような現象になったのか)

イベントログファイル※1

問題レポートとユーザーダンプ※2

OSの情報

jp1ssolog.bat

採取ファイル

%SystemRoot%\system32\drivers\etc配下

コマンド実行結果

hostname

set

netstat -a

netstat -aon

netstat -r

net start

ipconfig /all

レジストリ情報

HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\配下

HKEY_LOCAL_MACHINE\SOFTWARE\HITACHI\配下

tasklist

msinfo32

netsh -c advfirewall show allprofiles

netsh -c advfirewall firewall show rule name=all verbose

SSOの情報

jp1ssolog.bat

採取ファイル

SSOのインストールフォルダ\confフォルダ配下

SSOのインストールフォルダ\logフォルダ配下

SSOのインストールフォルダ\reportフォルダ配下

SSOのインストールフォルダ\uCPSB\CC\web\containers\SSOConsole\logs

SSOのインストールフォルダ\uCPSB\CC\web\containers\SSOConsole\usrconf

SSOのインストールフォルダ\uCPSB\CC\web\containers\SSOConsole\work

SSOのインストールフォルダ\uCPSB\httpsd\conf

SSOのインストールフォルダ\uCPSB\httpsd\logs

SSOのインストールフォルダ\uCPSB\CC\client\logs\system\ejbcl\CJW

SSOのインストールフォルダ\uCPSB\CC\web\redirector\logs

SSOのインストールフォルダ\auditlog配下

SSOのインストールフォルダ\tmp\ssoclustersetup.log(存在すれば)

%windir%\Temp\HCDINST\P-2942-8RCL.LOG(存在すれば)

%windir%\Temp\jp1cm2sso_installer.log(存在すれば)

SSOのインストールフォルダ\uCPSB\install.log(存在すれば)

SSOのインストールフォルダ\uCPSB\spkmanage.log(存在すれば)

SSOのインストールフォルダ\uCPSB\insresult.dat(存在すれば)

SSOのインストールフォルダ\Version.txt

SSOのインストールフォルダ\ProductInfo.txt

コマンド実行結果

ssostatus

ssoapcom -X 4095※3

ssocollectd -X 4095※3

ssocolmng -X 4095※3

ssorptd -X 4095※3

ssotrapd -X 4095※3

ssomapstatus -show -all

ssoapcom -F※3

ssocollectd -F※3

ssocolmng -F※3

インストールディレクトリ配下リスト

dir /s SSOのインストールフォルダ

jp1ssolog.bat

-colオプション指定

SSOのインストールフォルダ\databases\Coll配下

jp1ssolog.bat

エージェントのIPアドレスまたはホスト名指定

指定エージェントごとの ping -n 5 の結果

NNMiの情報

手動

コマンド実行結果

ovstatus

注※1

イベントログファイルの採取方法を次に示します。なお,イベントログファイルの採取方法は,Windowsの種類によって異なります。

イベントログファイルの採取方法(Windows Server 2008 R2の場合)
  1. [コントロールパネル]−[管理ツール]−[イベント ビューア]を選択する。

  2. [Windowsログ]−[アプリケーション],[セキュリティ],[システム]をそれぞれ選択し,[操作]メニュー−[すべてのイベントを名前をつけて保存]を選択し,[ファイルの種類]で[テキスト(タブ区切り)(*.txt)]にして任意のテキストファイル名で保存する。

イベントログファイルの採取方法(Windows Server 2012以降の場合)
  1. [コントロールパネル]−[管理ツール]−[イベント ビューア]を選択する。

  2. [Windowsログ]−[Application],[セキュリティ],[システム]をそれぞれ選択し,[操作]メニュー−[すべてのイベントを名前をつけて保存]を選択し,[ファイルの種類]で[テキスト(タブ区切り)(*.txt)]にして任意のテキストファイル名で保存する。

注※2

デーモンプロセスがアプリケーションエラーで停止した場合は問題レポートを,コマンドプロセスがアプリケーションエラーで停止した場合はユーザーダンプを手動で採取します。

問題レポートおよびユーザーダンプの採取方法を次に示します。

問題レポートの採取方法
  1. [コントロールパネル]−[アクション センター]の[メンテナンス]セクションから,[信頼性履歴の表示]を選択する。

    [コンピュータの信頼性と問題の履歴を確認]ウィンドウが表示されます。

  2. 下側の[問題レポートをすべて表示]を選択する。

    問題レポートの一覧が表示されます。

  3. 該当する問題をダブルクリックする。

    問題レポートの詳細が表示されます。

  4. [これらのファイルの一時的コピーを表示します]をクリックする。

    新しいウィンドウが開くので,ウィンドウ内に表示されたファイルを採取します。

ユーザーダンプの採取方法

エラーダイアログボックスが表示されている状態で,次の操作を実施します。

  1. タスクマネージャを起動する。

  2. [タスクマネージャ]ダイアログボックスの[プロセス]タブをクリックする。

  3. アプリケーションエラーで停止したプロセス名を右クリックし,[ダンプファイルの作成]を選択する。

    ユーザーダンプの出力先パスを示すダイアログボックスが表示されるので,ダイアログボックスに表示されたユーザーダンプの出力先パスからファイルを採取します。

注※3

対応する各デーモンプロセスが未起動のときは採取できません。