1.3.3 定義例
監視するリソースごとに,監視テンプレート,および監視テンプレート以外の定義例について説明します。定義例の見方を次に示します。
-
定義例の■と□は,PFM - Web Consoleのチェックボックスを示しています。
-
定義例の■は,PFM - Web Consoleでの設定で,チェックすることを示しています。また,□は,PFM - Web Consoleでの設定で,チェックしないことを示しています。
-
定義例の「dummy」はユーザーがシステム環境に応じて変更する文字列です。その他の定義内容については,必要に応じて変更してください。
-
定義例の発生頻度(例:[ 3 ]回しきい値超過/[ 5 ]インターバル中)は,システム環境によって異なります。発生頻度の定義内容は,必要に応じて変更してください。例えば,システム環境で処理が集中する時間帯が2分以上で継続的な高負荷状態であるとします。このとき,収集間隔が60秒であれば,5回中2回までは許容範囲であり,3回以上で継続的な高負荷状態であるといえます。よって,発生頻度には「[ 3 ]回しきい値超過/[ 5 ]インターバル中」と設定します。
(1) データベース
監視テンプレート,および監視テンプレート以外の定義例について説明します。
(a) 監視テンプレート
-
データベースキャッシュの使用率を監視する監視テンプレートのアラーム
表1‒8 データベースに関連する監視テンプレートのアラーム 監視テンプレートのアラーム
使用レコード
使用フィールド
異常条件
警告条件
値の見方
DbCacheEntries Usage
PI_PI
DbCache Entries Usage
> 80
> 65
データベースキャッシュの使用率(%)が継続して高い場合,もしくはピーク時にキャッシュを使い切っている場合,ディスクアクセスが発生し,パフォーマンスが低下するおそれがある。
この場合,データベースキャッシュの値を大きくするなどの対策が必要となる。
アラームの設定内容については,「7. 監視テンプレート」を参照してください。
-
データベースに関連する監視テンプレートのレポート
表1‒9 データベースに関連する監視テンプレートのレポート レポート名
表示する情報
DataDirectory Drive Usage Trend (Multi-Agent)
最近1か月間の複数システムのデータディレクトリの使用率(日単位)。
DbCache Usage Status
現在のデータベースキャッシュ使用率(分単位)。
Database Cache Detail
現在のデータベースキャッシュ詳細情報(分単位)。
DbCache Usage Status Summary
最近1時間のデータベースキャッシュ使用率の要約(分単位)。
Database Access Status - Top 10 Databases
アクセスが多かったデータベースの上位10個。※
Database Note Count Status - Top 10 Database
文書数の多いデータベースの上位10個。
Database Size Status - Top 10 Databases
サイズの大きいデータベースの上位10個。
- 注※
-
アクセスが多かったデータベースをレポート表示する場合,Lotus Domino上でstatlogサーバタスクを実行し,データベースの使用状況を各データベースに記録する設定にしておく必要があります。
レポートの設定内容については「7. 監視テンプレート」を参照してください。
(b) 監視テンプレート以外の定義例
-
データディレクトリの使用率を監視するアラーム
表1‒10 データディレクトリの使用率を監視する定義例 項目
内容
全般
プロダクト
Domino(3.0)
アラームテーブル名
Alarm Example
アラーム名
DataDirectory Usage
メッセージテキスト
%CVS1
□値の存在を監視するアラーム
□チェックしない
高度な設定
□ アラームを有効にする
■チェックする
□ 常にアラーム通知する
□チェックしない
□ すべてのデータを評価する
□チェックしない
監視時刻範囲
□ 常に監視する
■チェックする
開始
−
終了
−
発生頻度
□ 発生頻度を満たした時にアラーム通知する
□チェックしない
[ 1 ]回しきい値超過/[ 1 ]インターバル中
アラーム条件式
レコード
PI_PI
フィールド
異常条件:
Disk Datadir Drive Usage > "90"
条件
異常値
警告値
警告条件:
Disk Datadir Drive Usage > "80"
実行するアクション
任意で設定してください
異常
警告
正常
Eメール
□
□
□
コマンド
□
□
□
SNMP
□
□
□
表示するレポート
[ ]
PI_PIの履歴レポートを指定する。
- (凡例)
-
−:指定しない
(2) ユーザー
監視テンプレートの定義例について説明します。
(a) 監視テンプレート
-
ログインユーザー数を監視する監視テンプレートのアラーム
表1‒11 ユーザーに関連する監視テンプレートのアラーム 監視テンプレートアラーム
使用レコード
使用フィールド
異常条件
警告条件
値の見方
Login Users
PI_PI
Users
> 300
> 240
Lotus Dominoが許容しているユーザー数以上のアクセスが同時に発生すると,急激なパフォーマンス低下の原因となるおそれがある。
この場合,1サーバ当たりのアクセスユーザー数を調整するため,サーバを分割するなどの対策が必要となる。
アラームの設定内容については,「7. 監視テンプレート」を参照してください。
-
ユーザーに関連する監視テンプレートのレポート
表1‒12 ユーザーに関連する監視テンプレートのレポート レポート名
表示する情報
Login Users Status Trend (Multi-Agent)
最近1か月間の複数システムのログインユーザー数(日単位)。
Login Users Status (Multi-Agent)
最近24時間の複数システムのログインユーザー数(時単位)。
Login Users Status
現在のログインユーザー数(分単位)。
Login Users Status Summary
最近1時間のログインユーザー数(分単位)。
レポートの設定内容については「7. 監視テンプレート」を参照してください。
(3) メール
監視テンプレート,および監視テンプレート以外の定義例について説明します。
(a) 監視テンプレート
-
デッドメール・滞留メールを監視する監視テンプレートのアラーム
表1‒13 メールに関連する監視テンプレートのアラーム 監視テンプレートアラーム
使用レコード
使用フィールド
異常条件
警告条件
値の見方
Mail Dead Custom
PI_PI
Mail Dead UserCustom
>= 5
>= 1
配信不能状態となったメールがメールボックス内に発生しているおそれがある。
ネットワーク設定,接続文書の見直し,無効なユーザー設定が残っていないか確認するなどの対策が必要となる。
Mail Waiting Custom
PI_PI
Mail Waiting UserCustom
>= 5
>= 1
配信されるべきメールがキューの中に滞留し,メール配信が行われなくなっているおそれがある。
ネットワーク設定,接続文書の見直し,無効なユーザー設定が残っていないか確認するなどの対策が必要となる。ウィルスチェックソフトなどの不具合で発生することもあるため,ウィルスチェックソフト動作の確認も必要。
デッドメール,滞留メールになったと判定するまでの時間(分)は,PFM - Agent for Dominoのプロパティ「Minutes for remaining mail」「Minutes for dead mail」の設定に従います。値を変更したい場合は,PFM - Web ConsoleからPFM - Agent for Dominoのプロパティ値を変更してください。
アラームの設定内容については,「7. 監視テンプレート」を参照してください。
-
メールに関連する監視テンプレートのレポート
表1‒14 メールに関連する監視テンプレートのレポート レポート名
表示する情報
Mail Delivery Status Trend (Multi-Agent)
最近1か月間の複数システムのメール配信数(日単位)。
Dead Mail Status (Multi-Agent)
最近24時間の複数システムのデッドメール発生数(時単位)。
Waiting Mail Status (Multi-Agent)
最近24時間の複数システムの滞留メール発生数(時単位)。
Mail Delivery Status
現在のメール配信数(分単位)。
Mail Deliveries Detail
現在のメール配信数詳細情報(分単位)。
Dead Mail Status Summary
最近1時間のデッドメール発生数(分単位)。
Waiting Mail Status Summary
最近1時間の滞留メール発生数(分単位)。
Expired Mail Status - Top 10 Databases
期間超過しているメール文書が多いデータベースの上位10個。※1 ※2
Mail Database Size Status - Top 10 Databases
メールデータベースの中でサイズの大きいデータベースの上位10個。※3
- 注※1
-
期間超過メールになったと判定するまでの日数は,PFM - Agent for Dominoのプロパティ「Days for period-excess mail」の設定に従います。値を変更したい場合は,PFM - Web ConsoleからPFM - Agent for Dominoのプロパティ値を変更してください。
- 注※2
-
このレポートを使用すると,すべてのデータベースの文書にアクセスすることから,システムの負荷が非常に高くなります。そのため,夜間などシステムの負荷が低いときに使用することをお勧めします。
- 注※3
-
メールデータベースは,使用されているテンプレート名で判定しています。標準テンプレートは自動的に認識しますが,独自のテンプレート名を使用している場合は,テンプレート名をPFM - Agent for Dominoのプロパティ「User's mail template」に設定する必要があります。独自のテンプレート名を使用している場合は,PFM - Web ConsoleからPFM - Agent for Dominoのプロパティ値を変更してください。
レポートの設定内容については「7. 監視テンプレート」を参照してください。
(b) 監視テンプレート以外の定義例
-
配信エラーとなったメール数を監視したい
表1‒15 配信エラーとなったメール数を監視する定義例 項目
内容
全般
プロダクト
Domino(3.0)
アラームテーブル名
Alarm Example
アラーム名
Mail Total Failures
メッセージテキスト
Mail Total Failures is %CVS1
□ 値の存在を監視するアラーム
□チェックしない
高度な設定
□ アラームを有効にする
■チェックする
□ 常にアラーム通知する
□チェックしない
□ すべてのデータを評価する
□チェックしない
監視時刻範囲
□ 常に監視する
■チェックする
開始
−
終了
−
発生頻度
□ 発生頻度を満たした時にアラーム通知する
□チェックしない
[ 1 ]回しきい値超過/[ 1 ]インターバル中
アラーム条件式
レコード
PI_PIML
フィールド
異常条件:
TotFailures < "10"※1
条件
異常値
警告値
警告条件:
TotFailures < "5"※1
実行するアクション
任意で設定してください
異常
警告
正常
Eメール
□
□
□
コマンド
□
□
□
SNMP
□
□
□
表示するレポート
[ ]
PI_PIMLの履歴レポートを指定する。※2
- (凡例)
-
−:指定しない
- 注※1
-
この値はLotus Dominoサーバ起動時からの累計値です。一度発生した場合,サーバを再起動するまで正常値には戻りません。
- 注※2
-
履歴レポートを表示するため,PFM - Agent for Dominoのプロパティ「Interval Records」「PIML」の「Log」を「Yes」に設定しておく必要があります。
(4) メモリー
監視テンプレート,および監視テンプレート以外の定義例について説明します。
(a) 監視テンプレート
-
メモリーに関連する監視テンプレートのアラーム
表1‒16 メモリーに関連する監視テンプレートのアラーム 監視テンプレートアラーム
使用レコード
使用フィールド
異常条件
警告条件
値の見方
Mem Alloc Kbytes
PI_PI
Mem Alloc Kbytes
> 256000
(キロバイト)
> 128000
(キロバイト)
Lotus Dominoの使用するメモリー数が高くなり,メモリー不足になっているおそれがある。
この場合,物理メモリーを増強する,Lotus Domino上で起動するサーバタスク数を減らす,Lotus Dominoのサーバを複数のマシンに分割するなどの対策が必要となる。
アラームの設定内容については,「7. 監視テンプレート」を参照してください。
-
メモリーに関連する監視テンプレートのレポート
表1‒17 メモリーに関連する監視テンプレートのレポート レポート名
表示する情報
Domino Memory Status Trend (Multi-Agent)
最近1か月間の複数システムのメモリー使用量(日単位)。
Domino Memory Status
現在のメモリー使用量(分単位)。
Domino Memory Status Summary
最近1時間のメモリー使用量(分単位)。
レポートの設定内容については「7. 監視テンプレート」を参照してください。
(b) 監視テンプレート以外の定義例
-
メモリーの空き容量を監視するアラーム
表1‒18 メモリーの空き容量を監視する定義例 項目
内容
全般
プロダクト
Domino(3.0)
アラームテーブル名
Alarm Example
アラーム名
Mem Free Kbytes
メッセージテキスト
Mem Free Kbytes is %CVS1
□ 値の存在を監視するアラーム
□チェックしない
高度な設定
□ アラームを有効にする
■チェックする
□ 常にアラーム通知する
□チェックしない
□ すべてのデータを評価する
□チェックしない
監視時刻範囲
□ 常に監視する
■チェックする
開始
−
終了
−
発生頻度
□ 発生頻度を満たした時にアラーム通知する
■チェックする
[ 3 ]回しきい値超過/[ 5 ]インターバル中
アラーム条件式
レコード
PI_PI
フィールド
異常条件:
Mem Free Kbytes < "物理メモリーの10%+仮想メモリー容量程度を設定する"※
条件
異常値
警告値
警告条件:
Mem Free Kbytes < "物理メモリーの30%+仮想メモリー容量程度を設定する"※
実行するアクション
任意で設定してください
異常
警告
正常
Eメール
□
□
□
コマンド
□
□
□
SNMP
□
□
□
表示するレポート
[ ]
Reports/Domino/Troubleshooting/Recent Past/Domino Memory Status Summary
- (凡例)
-
−:指定しない
- 注※
-
「Mem Free Kbytes」は仮想メモリーを含んだ容量となるため,すべて物理メモリー内で運用するようにアラームを設定する場合,上記のような設定にする必要があります。特に仮想メモリーを使用するオーバーヘッドを気にしない場合は,許容される最大のメモリー容量を設定してください。
(5) 複製
監視テンプレート,および監視テンプレート以外の定義例について説明します。
(a) 監視テンプレート
-
複製に関連する監視テンプレートのアラーム
表1‒19 複製に関連する監視テンプレートのアラーム 監視テンプレートアラーム
使用レコード
使用フィールド
異常条件
警告条件
値の見方
Repl Cluster Failed
PI_PI
Repl Cluster Failed
> 3
> 1
Lotus Dominoのクラスタ間でデータベースの複製に失敗しているおそれがある。
この場合,ネットワーク設定,接続文書,複製の設定に関する見直しなどの対策が必要となる。
アラームの設定内容については,「7. 監視テンプレート」を参照してください。
-
複製に関連する監視テンプレートのレポート
表1‒20 複製に関連する監視テンプレートのレポート レポート名
表示する情報
Replication Status Trend (Multi-Agent)
最近1か月間の複数システムの複製数,およびエラー数(日単位)。
Replication Status
現在の複製数,およびエラー数(分単位)。
Cluster Replication Detail
現在の複製詳細情報(分単位)。
Replication Status Summary
最近1時間の複製数,およびエラー数(分単位)。
レポートの設定内容については「7. 監視テンプレート」を参照してください。
(b) 監視テンプレート以外の定義例
-
複製のエラーを監視したい
表1‒21 複製のエラーを監視する定義例 項目
内容
全般
プロダクト
Domino(3.0)
アラームテーブル名
Alarm Example
アラーム名
Repl Failed
メッセージテキスト
Repl Failed is %CVS1
□ 値の存在を監視するアラーム
□チェックしない
高度な設定
□ アラームを有効にする
■チェックする
□ 常にアラーム通知する
□チェックしない
□ すべてのデータを評価する
□チェックしない
監視時刻範囲
□ 常に監視する
■チェックする
開始
−
終了
−
発生頻度
□ 発生頻度を満たした時にアラーム通知する
□チェックしない
[ 1 ]回しきい値超過/[ 1 ]インターバル中
アラーム条件式
レコード
PI_PI
フィールド
異常条件:
Repl Failed > "3"※
条件
異常値
警告値
警告条件:
Repl Failed > "1"※
実行するアクション
任意で設定してください
異常
警告
正常
Eメール
□
□
□
コマンド
□
□
□
SNMP
□
□
□
表示するレポート
[ ]
PI_PIの履歴レポートを表示する。
- (凡例)
-
−:指定しない
- 注※
-
この値はLotus Dominoサーバ起動時からの累計値です。一度発生した場合,サーバを再起動するまで正常値には戻りません。
(6) ヘルスチェック
監視テンプレート,および監視テンプレート以外の定義例について説明します。
(a) 監視テンプレート
-
ヘルスチェックに関連する監視テンプレートのアラーム
なし
-
ヘルスチェックに関連する監視テンプレートのレポート
表1‒22 ヘルスチェックに関連する監視テンプレートのレポート レポート名
表示する情報
Health Check Status (4.0)
現在のサーバタスク稼働状況(分単位)。
レポートの設定内容については「7. 監視テンプレート」を参照してください。
(b) 監視テンプレート以外の定義例
-
サーバタスク稼働状況を監視するアラーム
表1‒23 サーバタスク稼働状況を監視する定義例 項目
内容
全般
プロダクト
Domino(4.0)
アラームテーブル名
Alarm Example
アラーム名
Server Task Down
メッセージテキスト
%CVS1 is down
□値の存在を監視するアラーム
□チェックしない
高度な設定
□ アラームを有効にする
■チェックする
□ 常にアラーム通知する
□チェックしない
□ すべてのデータを評価する
□チェックしない
監視時刻範囲
□ 常に監視する
■チェックする
開始
−
終了
−
発生頻度
□ 発生頻度を満たした時にアラーム通知する
■チェックする ※1
[ 3 ]回しきい値超過/[ 3 ]インターバル中
アラーム条件式
レコード
PI_PIHC
フィールド
異常条件:
Check Name <> "dummy"※2 ※3 ※4 ※5
AND ResponseTime < "0"
条件
異常値
警告値
警告条件:
Check Name <> "dummy"※2 ※3 ※4 ※5
AND ResponseTime < "0"
実行するアクション
任意で設定してください
異常
警告
正常
Eメール
□
□
□
コマンド
□
□
□
SNMP
□
□
□
表示するレポート
[ ]
PI_PIHCの履歴レポートを指定する。※6
- (凡例)
-
−:指定しない
- 注※1
-
一時的な障害の可能性もあるため,発生頻度は3回程度に設定することをお勧めします。
- 注※2
-
ResponseTimeは,サーバタスクのダウンを検出すると(-1)を返します。この値だけを評価するため,異常条件,警告条件には,同じ条件を設定します。
- 注※3
-
メッセージテキストに値を表示するためには,アラーム条件式にフィールドを設定する必要があります。このため,ResponseTimeフィールド以外を,必ず満たす条件値で定義しています。
- 注※4
-
ヘルスチェックの対象となるサーバタスクは,PFM - Agent for Dominoのプロパティ「Health Check Options」の設定に従います。値を変更したい場合は,PFM - Web ConsoleからPFM - Agent for Dominoのプロパティ値を変更してください。例えば,SMTPを監視対象としたい場合は,「Health Check Options」−「SMTP Port Check」の「Check」を「Yes」にしてください。
- 注※5
-
「"dummy"でない」という,必ず満たす条件値にすることで,監視対象となっているサーバタスクのどれかがダウンしている場合,アラームが発生します(すべてのサーバタスクが稼働している場合だけ「正常状態」になります)。特定のサーバタスクダウンだけにアラームを発生させたい場合は,「Check Name = "HTTP"」のように指定してください。
- 注※6
-
履歴レポートを表示するため,PFM - Agent for Dominoのプロパティの「Interval Records」−「PIHT」の「Log」を「Yes」に設定しておく必要があります。
-
サーバタスクダウンを自動復旧するアラームアクション定義
表1‒24 サーバタスクダウンを自動復旧するアラームアクション定義例 項目
内容
実行するアクション
異常
警告
正常
Eメール
□
□
□
コマンド
■
■
□
SNMP
□
□
□
コマンド定義
コマンド名
"c:\program files\hitachi\jp1pc\agtl\agent\notesrestart.exe" ※1
アクションハンドラ
LOCAL
コマンド引数
"c:\lotus\domino 300 600"※2
- 注※1
-
ロングファイル名の場合,必ず「"(ダブルクォーテーションマーク)」で囲んで指定してください。例はWindowsの場合です。Solaris,AIX上で実行する場合は「/opt/jp1pc/agtl/agent/notesrestart」としてください。またこのパス名はPFM - Agent for Dominoが動作しているマシンのパス名です。
- 注※2
-
ロングファイル名の場合,必ず「"(ダブルクォーテーションマーク)」で囲んで指定してください。例はWindowsの場合です。Solaris,AIX上で実行する場合は,第一引数に「ドミノサーバ起動ユーザー名」を指定してください。第二引数もUNIX上のパス名となるため,「/home/notes/notesdata」などの形式にしてください。
- 注意
-
「notesrestart」コマンドを使用する場合,OSとLotus Dominoの組み合わせによって,事前に次の環境設定が必要です。
<OSがWindowsの場合>
- R5シリーズ以前を使用している場合
-
-
ドミノプログラムディレクトリにあるqnc.exeを実行する。
-
「Options」の「Visual Notification」をオフに設定する。
-
- R6シリーズ以降をご使用の場合
-
環境設定は特に必要ありません。
<OSがUNIX(AIX,Solaris)の場合>
-
rootユーザーで,ドミノディレクトリを環境変数(NOTESDIR)に設定する。
Bシェルを使用する場合の設定例を次に示します。
NOTESDIR=/opt/lotus
export NOTESDIR
-
rootユーザーで,ドミノプログラムディレクトリを環境変数(Notes_ExecDirectory)に設定する。
Bシェルを使用する場合の設定例を次に示します。
・AIXの場合
Notes_ExecDirectory=/opt/lotus/notes/latest/ibmpow
export Notes_ExecDirectory
・Solarisの場合
Notes_ExecDirectory=/opt/lotus/notes/latest/sunspa
export Notes_ExecDirectory
(7) Notesログ監視
監視テンプレート,および監視テンプレート以外の定義例について説明します。
(a) 監視テンプレート
-
Notesログ監視に関連する監視テンプレートのアラーム
なし
-
Notesログ監視に関連する監視テンプレートのレポート
なし
(b) 監視テンプレート以外の定義例
-
Notesログに特定のメッセージが出力されたことを監視するアラーム
表1‒25 Notesログに特定のメッセージが出力されたことを監視する定義例 項目
内容
全般
プロダクト
Domino(4.0)
アラームテーブル名
Alarm Example
アラーム名
Error Message Output
メッセージテキスト
%CVS1
□値の存在を監視するアラーム
■チェックする※1 ※2
高度な設定
□ アラームを有効にする
■チェックする
□ 常にアラーム通知する
□チェックしない
□ すべてのデータを評価する
□チェックしない
監視時刻範囲
□ 常に監視する
■チェックする
開始
−
終了
−
発生頻度
□ 発生頻度を満たした時にアラーム通知する
□チェックしない
[ 1 ]回しきい値超過/[ 1 ]インターバル中
アラーム条件式
レコード
PL_PLNL※3
フィールド
Message Text
値
[ERROR]※4
実行するアクション
任意で設定してください
異常
警告
正常
Eメール
□
□
□
コマンド
□
□
□
SNMP
□
□
□
表示するレポート
[ ]
PL_PLNLの履歴レポートを指定する。※5
- (凡例)
-
−:指定しない
- 注※1
-
Notesログ監視機能は,検索条件に当てはまるメッセージだけが収集されるため,「値の存在を監視するアラーム」に設定する必要があります。
- 注※2
-
「値の存在を監視するアラーム」に設定しているため,一度アラーム状態となると自動的には正常状態に戻りません。Notesログを確認したあと,アラームテーブルのアンバインド,再バインドを実行してください。アラーム状態がリセットされ正常状態に戻ります。PFM - Agent for Dominoは,最後に検出した文字列以降のNotesログを監視し続けていますので,この操作を行ったあと,再度検索条件に合致したメッセージが出力されると,再びアラーム状態になります。
- 注※3
-
PFM - Agent for Dominoのプロパティ「Notes Log Check Options」の設定に従います。値を変更する場合は,PFM - Web ConsoleからPFM - Agent for Dominoのプロパティ値を変更してください。特に「Include」ファイルパス名(検索文字列を指定するファイル)は必ず指定してください。
- 注※4
-
「Include」ファイルで使用したセクション名を指定してください。
- 注※5
-
履歴レポートを表示するため,PFM - Agent for Dominoのプロパティの「Log Records」−「PLNL」の「Log」を「Yes」に設定しておく必要があります。また,「Collection Interval」は,Notesログファイルへの負荷を考慮し,デフォルト600秒と長めの設定にしています(10分に一度しか評価されない)。検出までの時間を短くしたい場合は,この値を短く設定してください。ただし,設定値を短く設定すると,Notesログへの負荷が高くなります。