Hitachi

高信頼化システム監視機能 HAモニタ Linux(R)(x86)編


付録C HAモニタが出力するファイル一覧

HAモニタが出力するファイルの一覧を,次の表に示します。

なお,ファイルパス名に記載している,historyetc,またはspoolで始まるパスは,/opt/hitachi/HAmon配下を表しています。

表C‒1 HAモニタが出力するファイル一覧

項番

名称

ファイルパス名

生成・削除タイミング

管理方法

サポートバージョン※1

形式

最大ファイルサイズ(バイト)

運用による削除可能なspoolファイル※10

1

障害情報の移送

任意

montsコマンド実行時のデフォルトは/tmp配下)

montsコマンド実行時

01-10以降

バイナリ

変動値※2

2

モジュールトレース

/opt/hitachi/HAmon/coreで始まるすべてのファイル

HAモニタの異常終了時

HAモニタ起動時に/opt/hitachi/HAmon下にファイルが2個以上ある場合,spool/save下をクリア後/opt/hitachi/HAmon下のcore を移動

01-10以降

バイナリ

675,840,000

3

リセットパス設定ファイル

etc/.CPSS_RESET

monsetupコマンドによるリセットパス設定時

1世代管理

01-62以前

テキスト

108

_oldの2世代管理(ただし,_oldspool/下に出力)

01-63以降

4

HAモニタ起動情報制御ファイル

etc/.CTLFILE

HAモニタ起動時

1世代管理

01-10以降

バイナリ

32

5

HAモニタの起動/停止方法の設定判定ファイル

etc/.HApwon_manual

monsetupコマンドによる自動起動/停止設定時

1世代管理

01-30以降

テキスト

0

6

etc/.HApwoff_manual

7

リセットパスオプション設定ファイル

etc/.RSTDENV

monsetupコマンドによるリセットパス設定時

1世代管理

01-62以前

テキスト

42

_oldの2世代管理(ただし,_oldspool/下に出力)

01-63以降

8

接続設定

etc/connection

HAモニタ停止時

1世代管理

01-10以降

テキスト

変動値※3

9

サーバ対応の環境設定ファイルのバックアップ

etc/servers.bac

mondeviceコマンド実行時(-cオプション指定時を除く)

1世代管理

01-10以降

テキスト

変動値※4

10

監視履歴

history/patrol_history

サーバの監視履歴を取得する場合(ph_log_sizeオペランドを指定)に,系およびサーバのスローダウン回復時

_oldの2世代管理

(ラップアラウンド方式,およびラウンドロビン方式)

01-12以降

テキスト

10,485,760

11

HAモニタ開始メッセージ読み捨て情報

spool/.dup_start

他系から古いHAモニタの開始メッセージ受信時

.bakの2世代管理

01-10以降

バイナリ

73,400,320

12

fuser実行結果

spool/.ERRdisk_で始まるすべてのファイル

ディスク切り離しの障害時

デバイス数×.bakの2世代管理

01-10以降

テキスト

199,680

13

haiodのトラブルシュート情報

spool/.haiod_trace

スローダウンなどの障害発生時※6

spool/下とspool/haiod_trace/下に21世代管理

01-11以降

テキスト

01-33まで

4,142,080

01-40以降

4,142,080〜8,749,056※5

14

halrstdのトラブルシュート情報

spool/.halrstd_trace

スローダウンなどの障害発生時※6

spool/下とspool/halrstd_trace/下に21世代管理

01-50以降

テキスト

4,178,944

15

VMware ESXiレスポンス情報

spool/.halrstdlog

HAモニタ起動時,系間接続時,または系障害検出時

1世代管理(ラップアラウンド方式)

01-50以降

テキスト

1,049,120

16

hcmaliveのトラブルシュート情報

spool/.hcmalive_trace

スローダウンなどの障害発生時※6

spool/下とspool/hcmalive_trace/下に21世代管理

01-32以降

テキスト

4,178,944

17

hcmreadのトラブルシュート情報

spool/.hcmr_trace

スローダウンなどの障害発生時※6

spool/下とspool/hcmr_trace/下に21世代管理

01-10以降

テキスト

01-30以前

20,480

01-31〜01-33

4,178,944

01-40以降

4,178,944〜8,749,056※5

18

JP1エラー情報

spool/.jp1log

JP1のイベント通知機能を使用する場合(jp1_eventオペランドを指定)に,JP1イベントの登録処理の異常時

1世代管理

01-10以降

テキスト

4,096

19

HAモニタ内部メッセージログ

spool/.msglog

HAモニタのメッセージ出力時

1世代管理

(ラップアラウンド方式)

01-10以降

テキスト

01-33まで

917,504

01-40以降

917,504(ただし,HAモニタ Extension使用時は26,240,000)

×

20

hcmaliveプロセス制御用ソケットファイル

spool/.s_alive

HAモニタ起動/停止時

1世代管理

01-30以降

バイナリ

0

×

21

hcmaliveのコマンド処理用ソケットファイル

spool/.s_alivecmd

HAモニタ起動/停止時

1世代管理

01-31以降

バイナリ

0

×

22

コマンド用ソケットファイル

spool/.s_cmnd

HAモニタ起動/停止時

1世代管理

01-10以降

バイナリ

0

×

23

内部イベント制御用ソケットファイル

spool/.s_event

HAモニタ起動/停止時

1世代管理

01-10以降

バイナリ

0

×

24

halrstdプロセス制御用ソケットファイル

spool/.s_halrstd

HAモニタ起動/停止時

1世代管理

01-50以降

バイナリ

0

×

25

hcmreadのコマンド処理用ソケットファイル

spool/.s_hcmrcmd

HAモニタ起動/停止時

1世代管理

01-31以降

バイナリ

0

×

26

haiodプロセス制御用ソケットファイル

spool/.s_iod

HAモニタ起動/停止時

1世代管理

01-10以降

バイナリ

0

×

27

spool/.s_iod2

28

spool/.s_iodother

29

spool/.s_iodcmd

30

haiodのUAP用APIインタフェースソケット

spool/.s_iod_up

HAモニタ起動/停止時

1世代管理

01-42以降

バイナリ

0

×

31

prcmainプロセス外部イベント制御用ソケットファイル

spool/.s_other

HAモニタ起動/停止時

1世代管理

01-10以降

バイナリ

0

×

32

サーバ制御用ソケットファイル

spool/.s_path

HAモニタ起動/停止時

1世代管理

01-10以降

バイナリ

0

×

33

haresetdプロセス制御用ソケットファイル

spool/.s_resetd

HAモニタ起動/停止時

1世代管理

01-10以降

バイナリ

0

×

34

障害管理プロセサレスポンス情報

spool/.sphralog

HAモニタ起動時,リセットパス障害時,または障害管理プロセサコマンド送受信時

1世代管理

(ラップアラウンド方式)

01-10以降

テキスト

01-33まで

21,248

01-40以降

21,248(ただし,HAモニタ Extension使用時は1,049,120)

01-53以降

524,560

×

35

コマンドログ

spool/cmdlog/.cmdlog1

HAモニタのコマンド,およびユーザコマンドの実行/終了時

1世代管理

(ラップアラウンド方式)

01-11以降

テキスト

917,504

×

36

spool/cmdlog/.cmdlog2

01-33まで

917,504

01-40以降

917,504(ただし,HAモニタ Extension使用時は3,145,728)

37

spool/cmdlog/.uoclog

01-33まで

917,504

01-40以降

917,504(ただし,HAモニタ Extension使用時は83,886,080)

38

spool/cmdlog/.unamewrap.log

moncheckおよびHAモニタ起動時

.bakの2世代管理

01-60以降

テキスト

10,240

×

39

spool/cmdlog/.unamewrap_ins.log

インストール時

テキスト

10,240

×

40

トラブルシュート拡張情報

spool/DUPSTART_EX

他系から古いHAモニタの開始メッセージ受信時

.bakの2世代管理

01-11以降

テキスト

199,680

41

spool/DUPSTART_EX_TOP※7

20,480

42

spool/ERRPATH_*_EX

監視パス障害時

199,680

43

spool/ERRPATH_*_EX_TOP※7

20,480

44

spool/HOSTSLOW_相手ホスト名_EX

他系の7割沈み込み時

199,680

45

spool/HOSTSLOW_相手ホスト名_EX_TOP※7

20,480

46

spool/HOSTSLOW_自ホスト名_EX

自系のスローダウン回復時

199,680

47

spool/HOSTSLOW_自ホスト名_EX_TOP※7

20,480

48

spool/MONTS_EX

montsコマンド実行時

199,680

49

spool/MONTS_EX_TOP※7

20,480

50

spool/RESET_EX

システムリセット時

199,680

51

spool/RESET_EX_TOP※7

20,480

52

spool/SERVSLOW_サーバ名_EX

サーバの7割沈み込み時

199,680

53

spool/SERVSLOW_サーバ名_EX_TOP※7

20,480

54

spool/PTRLCMD_EX_SERVSLOW_サーバ名_EX

モニタモードのサーバの監視機能の使用時,ptrlcmd_ex_tmout秒の7割沈み込み時

01-65以降

199,680

55

spool/PTRLCMD_EX_SERVSLOW_サーバ名_EX_TOP※7

20,480

56

監視パス障害情報

spool/ERRPATH_で始まるすべてのファイル

監視パス障害時

監視パス数×.bakの2世代管理

01-10以降

バイナリ

73,400,320

57

スローダウン時のデバッグ情報

spool/HOSTSLOW_相手ホスト名

他系の7割沈み込み時

ホスト数×.bakの2世代管理

01-10以降

バイナリ

73,400,320

58

spool/HOSTSLOW_自ホスト名

自系のスローダウン回復時

.bakの2世代管理

59

spool/SERVSLOW_サーバ名

サーバの7割沈み込み時

サーバ数×.bakの2世代管理

60

spool/UAPSLOW_UAP識別名

UAPの7割沈み込み時

プログラム数×1世代管理

01-42以降

61

spool/PTRLCMD_EX_SERVSLOW_サーバ名

モニタモードのサーバの監視機能の使用時,ptrlcmd_ex_tmout秒の7割沈み込み時

.bakの2世代管理

01-65以降

62

LAN監視の監視状況

spool/lanpatrol/IF名称.log

LANの監視機能使用時

1世代管理

(ラップアラウンド方式)

また,メッセージKAMN529-IおよびKAMN530-E出力時に_judgeに退避※8

01-40以降

および

01-56以降※8

テキスト

917,504

63

spool/lanpatrol/IF名称_stat.log

4,096

64

LAN監視スクリプトの内部実行ログ

spool/lanpatrol/lanpatrol_IF名称.log

LANの監視機能使用時

_oldで2世代管理

(LAN監視機能使用時に,LAN監視スクリプトの実行時間がLANの監視間隔を超えたときに_errに退避)

また,メッセージKAMN529-IおよびKAMN530-E出力時に_judgeに退避※8

01-52以降

および

01-56以降※8

テキスト

5,242,880

65

システムリセット時の障害情報

spool/RESET

システムリセット時

.bakの2世代管理

01-10以降

バイナリ

73,400,320

66

SCSIリザーブ/パスチェックエラー情報※9

spool/scsi3PR_check_err_サーバ識別名.scsilog

SCSIリザーブおよびSCSI接続パスチェックでSCSIコマンドのエラー発生時

_oldの2世代管理

01-52以降

テキスト

10,485,760

67

SCSIリザーブ実行情報※9

spool/scsi3PR_サーバ識別名.scsilog

サーバ起動時

サーバ停止時

SCSIコマンド発行時)

_oldの2世代管理

01-52以降

テキスト

10,485,760

spool/scsi3PR_scsiclr_サーバ識別名.scsilog

monscsiclrコマンド実行時

01-58以降

68

統計情報

spool/sms

(spool/oldsms

系およびサーバのスローダウン時

01-10以前:

_oldの2世代管理

(単調増加方式)

01-11以降:

_oldの2世代管理

(ラップアラウンド方式,およびラウンドロビン方式)

01-10以降

テキスト

01-10以前

単調増加

01-11以降

102,400

69

使用可能なリソースの制限情報

spool/ulimit.log

HAモニタ起動時

1世代管理

01-22以降

テキスト

703

70

ファイルシステム切り替え情報

spool/サーバ識別.fslog

ファイルシステムの切り替え時

サーバ数×_oldの2世代管理

01-10以降

テキスト

2,147,483,647

71

マルチパスコマンドの実行情報※9

spool/サーバ識別名.mplog

サーバ起動時

_oldの2世代管理

01-52以降

テキスト

65,535

72

LANの状態設定ファイル実行結果

spool/サーバ識別名.up.log

サーバの起動/停止時

サーバ数×.bakの2世代管理

01-12以降

テキスト

5,120

73

spool/サーバ識別名.down.log

74

ボリュームグループの接続,および切り離し実行情報

spool/ボリュームグループ名.vglog

vgchange -a yコマンド実行時

ボリュームグループ数×_oldの2世代管理

01-10以降

テキスト

65,535

75

メッセージログ

/var/log/messagesで始まるすべてのファイル

HAモニタのメッセージ出力時

01-10以降

テキスト

/etc/syslog.confに指定されたサイズ

76

リセットパス設定時の通信エラー時の設定

spool/.CPSS_RESET_err

monsetupによるリセットパス設定時

1世代管理

01-63以降

テキスト

108

spool/.RSTDENV_err

42

77

監視コマンドの実行ログ

spool/ptrlcmd_ex/サーバ識別名_ptrlcmdlog

  • ptrlcmd_exオペランドに監視コマンドを指定したサーバが,実行サーバとして起動したとき

  • sby_ptrlcmd_exオペランドに監視コマンドを指定したサーバが,待機サーバとして起動したとき

.bak.bak2の3世代管理

01-65以降

テキスト

917,504

×

78

監視コマンドの詳細ログ

spool/ptrlcmd_ex/サーバ識別名.log

  • ptrlcmd_exオペランドに監視コマンドを指定したサーバが,実行サーバとして起動したとき

  • sby_ptrlcmd_exオペランドに監視コマンドを指定したサーバが,待機サーバとして起動したとき

1世代管理

01-65以降

テキスト

任意(監視コマンドのサンプル(patrol_ex.sh)では,約1,000)

spool/ptrlcmd_ex/サーバ識別名.log_err

  • ptrlcmd_exオペランドに監視コマンドを指定したサーバが,実行サーバとして稼働中にサーバ障害を検出したとき

  • sby_ptrlcmd_exオペランドに監視コマンドを指定したサーバが,待機サーバとして稼働中にサーバ障害を検出したとき

79

リセットパス初期化時レスポンス情報

spool/.gtstpxlog

  • HAモニタを起動したとき

  • リセットパスの初期化に失敗したあと,リセットパスが回復したとき

.bakの2世代管理

01-68以降

テキスト

1,537

×

80

ディスクの監視の実行状況ログ

spool/disk_patrol/ディスクの監視対象のファイルの絶対パス※11_log

ディスクの監視を開始したとき

1世代管理

(ラップアラウンド方式)

01-69以降

テキスト

10,485,760

spool/disk_patrol/ディスクの監視対象のファイルの絶対パス※11_log_err

ディスクの監視でディスクへのアクセスに失敗したとき

1世代管理

81

NFS用の起動コマンドの実行ログ

spool/サーバ識別名.nfsactlog

実行サーバの起動時

_oldの2世代管理

01-79以降

テキスト

10,485,760

82

NFS用の停止コマンドの実行ログ

spool/サーバ識別名.nfstermlog

実行サーバの停止時

_oldの2世代管理

01-79以降

テキスト

10,485,760

83

NFS用の監視コマンドの実行ログ

spool/サーバ識別名.nfsptrllog

  • 実行サーバの起動時

  • 実行サーバの稼働中

_oldの2世代管理

01-79以降

テキスト

10,485,760

spool/サーバ識別名.nfsptrllog_err

1世代管理

84

HApwonでのcgroupチェックの実行ログ

spool/.hapwoncgchklog

HAモニタの起動時

_oldの2世代管理

01-79以降

テキスト

変動値※12

85

monttyでのcgroupチェックの実行ログ

spool/.monttycgchklog

monsetupコマンドでリセットパスの設定時

_oldの2世代管理

01-79以降

テキスト

変動値※12

(凡例)

○:削除できます。

×:削除できません。

−:該当しません。

注※1

バージョン01-41以前のファイルについては,P-9S2C-E111 HAモニタでのサポート対象となります。

注※2

/opt/hitachi/HAmon/etc配下などを一括して取得し,HAモニタ以外のファイルも移送するため,最大ファイルサイズは変化します。

注※3

接続ホスト数,および監視パス数によって最大ファイルサイズは変化します。

注※4

デバイス定義の数によって最大ファイルサイズは変化します。

注※5

servmaxオペランド,およびhostmaxオペランドの指定値によって最大ファイルサイズは変化します。

注※6

次のどれかのタイミングでファイルが出力されます。

・HAモニタのトラブルシュート情報収集コマンド(montsコマンド)を実行したとき(表の項番1に該当)

・監視パスの障害を検知したとき(表の項番52に該当)

・他系のスローダウンを検知したとき(表の項番53に該当)

・自系のスローダウンを検知したとき(表の項番54に該当)

・自系のサーバのスローダウンを検知したとき(表の項番55に該当)

・自系のUAPのスローダウンを検知したとき(表の項番56に該当)

・他系をリセットするとき(表の項番60に該当)

注※7

"xxx_EX_TOP"には,topコマンドの結果が取得されます。

注※8

_judgeに退避はバージョン01-56以降です。バージョン01-55以前,またはバージョン01-56以降でLANの通信可否による系切り替え制御機能を使用しない場合は_judgeに退避しません。

注※9

共有ディスクのSCSIリザーブをする場合に出力されます。

注※10

HAモニタを停止してから削除してください。また,ディレクトリは削除しないでください。

注※11

ディスクの監視対象のファイルの絶対パスは,/を-に置き換えて組み立てます。

注※12

cgroupのバージョンおよび構成によって最大ファイルサイズは変化します。