Hitachi

高信頼化システム監視機能 HAモニタ AIX(R)編


付録C HAモニタが出力するファイル一覧

HAモニタが出力するファイルの一覧を,次の表に示します。

なお,ファイルパス名に記載している,history,etc,またはspoolで始まるパスは,/opt/hitachi/HAmon配下を表しています。

表C‒1 HAモニタが出力するファイル一覧

項番

名称

ファイルパス名

生成・削除

タイミング

管理方法

サポートバージョン

形式

最大ファイルサイズ(バイト)

運用による削除可能なspoolファイル※7

1

メッセージログ

任意

(AIXは標準でsyslogが出力されないため,ユーザがsyslogの出力先を設定(/var/adm/syslog.logなど))

HAモニタのインストール後にユーザが設定したとき

01-00以降

テキスト

/etc/syslog.confに指定されたサイズ

2

モジュールトレース

/opt/hitachi/HAmon/core

HAモニタの異常終了時

01-00以降

バイナリ

7,981,056

3

統計情報

spool/sms

spool/oldsms

系およびサーバのスローダウン時

01-10以前:

_oldの2世代管理

(単調増加方式)

01-11以降:

_oldの2世代管理

(ラップアラウンド方式,およびラウンドロビン方式)

01-00以降

テキスト

01-10以前

単調増加

01-11以降

102,400

4

障害情報の移送

任意

monts実行時のデフォルトは/tmp配下)

montsコマンド実行時

01-00以降

バイナリ

変動値※1

5

ホスト間通信メッセージトレース

spool/.hcm_trace

ホスト間通信時

1世代管理

(ラップアラウンド方式)

01-00以降

テキスト

8,192

6

系切替機構レスポンス情報

spool/.sphralog

HAモニタ起動時,リセットパス障害時,または系切替機構のコマンド送受信時

1世代管理

(ラップアラウンド方式)

01-12以降

テキスト

21,248

×

7

システムリセット時の障害情報

spool/RESET

システムリセット時

bakの2世代管理

01-00以降

バイナリ

11,534,336

8

監視パス障害情報

spool/ERRPATH_で始まるすべてのファイル

監視パス障害時

監視パス数×.bakの2世代管理

01-00以降

バイナリ

11,534,336

9

haiodのトラブルシュート情報

spool/.haiod_trace

スローダウンなどの障害発生時※6

spool/下とspool/haiod_trace/下に21世代管理

01-11以降

テキスト

4,142,080

10

LANの状態設定ファイル実行結果

spool/サーバ名.up.log

サーバの起動/停止時

サーバ数×.bakの2世代管理

01-12以降

テキスト

5,120

11

spool/サーバ名.down.log

テキスト

5,120

12

ファイルシステム切り替え情報

spool/サーバ名.fslog

ファイルシステムの切り替え時

サーバ数×oldの2世代管理

01-01以降

テキスト

65,536

13

ASSIST通報機能

/var/adm/ras/errlog

errlog()発行でAIXが情報出力)

エラー・ログ・デーモンがあらかじめテンプレートに登録されたエラーを検出したとき

01-05以降

テキスト

変動値※4

14

HAモニタ内部メッセージログ

spool/.msglog

HAモニタのメッセージ出力時

1世代管理

(ラップアラウンド方式)

01-00以降

テキスト

917,504

×

15

hcmreadのトラブルシュート情報

spool/.hcmr_trace

スローダウンなどの障害発生時※6

spool/下とspool/hcmr_trace/下に21世代管理

01-00以降

テキスト

20,480

16

fuser実行結果

spool/.ERRdisk_で始まるすべてのファイル

disk切り離しの障害時

デバイス数×.bakの2世代管理

01-01以降

テキスト

199,680

17

make情報ログ

spool/.mklog

HAモニタセットアップ時

01-00以降

テキスト

30,720

18

スローダウン時のデバッグ情報

spool/SERVSLOW_サーバ名

サーバの7割沈み込み時

サーバ数×.bakの2世代管理

01-05以降

バイナリ

11,534,336

19

spool/HOSTSLOW_相手ホスト名

他系の7割沈み込み時

ホスト数×.bakの2世代管理

バイナリ

11,534,336

20

spool/HOSTSLOW_自ホスト名

自系のスローダウン回復時

.bakの2世代管理

バイナリ

11,534,336

21

spool/PTRLCMD_EX_SERVSLOW_サーバ名

モニタモードのサーバの監視機能の使用時,ptrlcmd_ex_tmout秒の7割沈み込み時

.bakの2世代管理

01-27以降

バイナリ

73,400,320

22

トラブルシュート拡張情報

spool/RESET_EX

システムリセット時

.bakの2世代管理

01-11以降

テキスト

199,680

23

spool/ERRPATH_*_EX

監視パス障害時

テキスト

199,680

24

spool/SERVSLOW_サーバ名_EX

サーバの7割沈み込み時

テキスト

199,680

25

spool/HOSTSLOW_相手ホスト名_EX

他系の7割沈み込み時

テキスト

199,680

26

spool/HOSTSLOW_自ホスト名_EX

自系のスローダウン回復時

テキスト

199,680

27

spool/MONTS_EX

montsコマンド実行時

テキスト

199,680

28

spool/PTRLCMD_EX_SERVSLOW_サーバ名_EX

モニタモードのサーバの監視機能の使用時,ptrlcmd_ex_tmout秒の7割沈み込み時

01-27以降

テキスト

199,680

29

ボリューム・グループ接続および切り離し実行情報

spool/ボリュームグループ名. vglog

varyonvgおよびvaryoffvg実行時

ボリュームグループ数×oldの2世代管理

01-07以降

テキスト

65,535

30

HAモニタ開始メッセージ読み捨て情報

spool/.dup_start

他系からの古い時刻のHAモニタ開始メッセージ受信時

同名のファイルが存在する場合は上書きで1世代の取得

01-08以降

バイナリ

41,060

31

コマンドログ

spool/cmdlog/.cmdlog1

HAモニタのコマンド,およびユーザコマンドの実行/終了時

1世代管理

(ラップアラウンド方式)

01-11以降

テキスト

917,504

×

32

spool/cmdlog/.cmdlog2

テキスト

917,504

×

33

spool/cmdlog/.uoclog

テキスト

917,504

×

34

haiodのメモリダンプ

spool/haiod/core

haiod異常終了時

-

01-11以降

バイナリ

6,469,632

35

監視履歴

history/patrol_history

サーバの監視履歴を取得する場合(ph_log_sizeオペランドを指定)に,系およびサーバのスローダウン回復時

_oldの2世代管理

(ラップアラウンド方式,およびラウンドロビン方式)

01-12以降

テキスト

10,485,760

36

監視パスLANのネットワーク番号取得ログ

spool/.monnet.IPアドレス

ネットワークアドレス取得時

1世代管理

01-20以降

テキスト

3,000

37

spool/.monnet.IPアドレス-b

ブロードキャストアドレス取得時

1世代管理

3,000

38

XNFコマンド実行時ログ

spool/.LAlog.サーバ識別名

XNFコマンド(xnfonlin,xnfstandby,xnfshow)の実行時

oldで2世代管理

01-20以降

テキスト

65,535

39

RRFとの通信ログ

spool/.rrflog

リセットリンクを構成する系切り替え機構との通信時

1世代管理

01-00以降

テキスト

32,768

40

ttyとの通信ログ

spool/.ttylog

リセット専用LAN(RS-232C LAN)を構成する系切り替え機構との通信時

bakで2世代管理

01-01以降

テキスト

32,768

41

mondumpdev詳細情報

spool/.devlog

mondumpdevコマンドの実行時

bakで2世代管理

01-05以降

テキスト

32,768

42

JP1エラー情報

spool/.jp1log

JP1のイベント通知機能を使用する場合(jp1_eventオペランドを指定)に,JP1イベントの登録処理の異常時

1世代管理

01-00以降

テキスト

4,096

43

HAB実行情報

spool/ボリュームグループ名.hablog

HA Booster Pack使用時,hab_gidオペランドに指定した制御グループに対して,VGの登録/除外を行うとき

bakで2世代管理

01-10以降

テキスト

65,535

44

HAモニタ起動情報制御ファイル

etc/.CTLFILE

HAモニタ起動時

1世代管理

01-10以降

バイナリ

32

45

サーバ対応の環境設定ファイルのバックアップ

etc/servers.bac

mondeviceコマンド実行時("-c"を除く)

1世代管理

01-10以降

テキスト

変動値※2

46

HAモニタの起動・停止方法の設定判定ファイル

etc/.HApwon_manual

monsetupコマンドによる自動起動設定時

1世代管理

01-30以降

テキスト

0

47

etc/.HApwoff_manual

monsetupコマンドによる自動停止設定時

1世代管理

01-30以降

テキスト

0

48

接続設定

etc/connection

HAモニタ停止時

1世代管理

01-00以降

テキスト

変動値※3

49

リセットパス設定ファイル

etc/.CPSS_RESET

monsetupコマンドによるリセットパス設定時

1世代管理

01-03以降

テキスト

108

50

etc/.S85HRA_RESET

01-02以降

28

51

etc/.EXTHRL_RESET

01-03以降

28

52

etc/.S85DIRECT

01-05以降

28

53

リセットパスオプション設定ファイル

etc/.RSTDENV

monsetupコマンドによるリセットパス設定時

1世代管理

01-04以降

テキスト

42

54

サーバ制御用ソケットファイル

spool/.s_path

HAモニタ起動/停止時

1世代管理

01-00以降

バイナリ

0

×

55

内部イベント制御用ソケットファイル

spool/.s_event

HAモニタ起動/停止時

1世代管理

01-00以降

バイナリ

0

×

56

コマンド用ソケットファイル

spool/.s_cmnd

HAモニタ起動/停止時

1世代管理

01-00以降

バイナリ

0

×

57

haiodプロセス制御用ソケットファイル

spool/.s_iod

HAモニタ起動/停止時

1世代管理

01-00以降

バイナリ

0

×

58

spool/.s_iod2

HAモニタ起動/停止時

1世代管理

01-10以降

バイナリ

0

×

59

spool/.s_iodother

HAモニタ起動/停止時

1世代管理

01-12以降

バイナリ

0

×

60

spool/.s_iodcmd

HAモニタ起動/停止時

1世代管理

01-12以降

バイナリ

0

×

61

prcmain外部イベント制御用ソケットファイル

spool/.s_other

HAモニタ起動/停止時

1世代管理

01-00以降

バイナリ

0

×

62

haresetdプロセス制御用ソケットファイル

spool/.s_resetd

HAモニタ起動/停止時

1世代管理

01-01以降

バイナリ

0

×

63

リセットパス未設定環境での起動制御ファイル

etc/.norpstart

monsetupコマンドで-norpstartオプションによる設定時

1世代管理

01-24以降

テキスト

0

64

sysdumpstartエラーログ

spool/sysdumpstart.log

自系addressの通報受信時

1世代管理

01-24以降

テキスト

変動値※5

65

監視コマンドの実行ログ

spool/ptrlcmd_ex/サーバ識別名_ptrlcmdlog

  • ptrlcmd_exオペランドに監視コマンドを指定したサーバが,実行サーバとして起動したとき

  • sby_ptrlcmd_exオペランドに監視コマンドを指定したサーバが,待機サーバとして起動したとき

.bak.bak2の3世代管理

01-27以降

テキスト

917,504

×

66

監視コマンドの詳細ログ

spool/ptrlcmd_ex/サーバ識別名.log

  • ptrlcmd_exオペランドに監視コマンドを指定したサーバが,実行サーバとして起動したとき

  • sby_ptrlcmd_exオペランドに監視コマンドを指定したサーバが,待機サーバとして起動したとき

1世代管理

01-27以降

テキスト

任意(監視コマンドのサンプル(patrol_ex.sh)では,約1,000)

67

spool/ptrlcmd_ex/サーバ識別名.log_err

  • ptrlcmd_exオペランドに監視コマンドを指定したサーバが,実行サーバとして稼働中にサーバ障害を検出したとき

  • sby_ptrlcmd_exオペランドに監視コマンドを指定したサーバが,待機サーバとして稼働中にサーバ障害を検出したとき

68

SCSIリザーブ実行情報

/opt/hitachi/HAmon/spool/scsi3PR_サーバ識別名.scsilog

サーバ起動時

サーバ停止時

oldで2世代管理

01-28以降

テキスト

10,485,760

69

/opt/hitachi/HAmon/spool/scsi3PR_scsiclr_サーバ識別名.scsilog

monscsiclrコマンド実行時

70

SCSIリザーブ/パスチェックエラー情報

/opt/hitachi/HAmon/spool/scsi3PR_check_err_サーバ識別名.scsilog

SCSIリザーブおよびSCSI接続パスチェックでSCSIコマンドのエラー発生時

oldで2世代管理

01-28以降

テキスト

10,485,760

71

ディスクの監視の実行状況ログ

spool/disk_patrol/ディスクの監視対象のファイルの絶対パス※8_log

ディスクの監視を開始したとき

1世代管理

01-30以降

テキスト

10,485,760

spool/disk_patrol/ディスクの監視対象のファイルの絶対パス※8_log_err

ディスクの監視でディスクへのアクセスに失敗したとき

(凡例)

○:削除できます。

×:削除できません。

−:該当しません。

注※1

/opt/hitachi/HAmon/etc配下などを一括して取得し,HAモニタ以外のファイルも移送するため,最大ファイルサイズは変化します。

注※2

デバイス定義の数によって最大ファイルサイズは変化します。

注※3

接続ホスト数,および監視パス数によって最大ファイルサイズは変化します。

注※4

OSの設定によって最大ファイルサイズは変化します。

注※5

コマンドのエラー出力の内容によって最大ファイルサイズは変化します。

注※6

次のどれかのタイミングでファイルが出力されます。

・HAモニタのトラブルシュート情報収集コマンド(montsコマンド)を実行したとき(表の項番4に該当)

・監視パスの障害を検知したとき(表の項番8に該当)

・他系のスローダウンを検知したとき(表の項番19に該当)

・自系のスローダウンを検知したとき(表の項番20に該当)

・自系のサーバのスローダウンを検知したとき(表の項番18に該当)

・他系をリセットするとき(表の項番7に該当)

注※7

HAモニタを停止してから削除してください。また,ディレクトリは削除しないでください。

注※8

ディスクの監視対象のファイルの絶対パスは,/を-に置き換えて組み立てます。