1.3.2 パフォーマンス監視のしかた
レコード名は,レコードIDで表記しています。フィールド名は,PFM - View名で表記しています。正式なレコード名,フィールド名については,「8. レコード」を参照してください。
フィールドの説明は概要だけを記載しています。フィールドの詳細な説明については,「8. レコード」を参照してください。
(1) データベース
(a) 概要
Lotus Dominoはファイル形式のデータベースを採用しています。このため,一度に多数のデータベースにアクセスが発生すると,データベースキャッシュなどが不足したり,データベースの肥大化によりディスク容量を圧迫したりします。これらの問題に対応するために,ディスクキャッシュの使用率やデータディレクトリの使用率を監視します。
関連するレコードとフィールドを次の表に示します。
使用レコード |
使用フィールド |
値の見方(例) |
---|---|---|
PI_PI |
DbCache Entries Usage |
データベースキャッシュ使用率。この値が常に高い数値を示している,もしくはピーク時に不足している場合,データベースキャッシュの値を増やすなどの対策が必要となる。 |
DbCache OvercrowdRejects |
データベースキャッシュを超えるアクセスがあり,アクセス拒否となったリクエストの回数。この値が0でない場合は,データベースキャッシュの値を増やす,もしくはデータベースをほかのサーバに分割するなどの対策が必要となる。 |
|
Disk Datadir Drive Usage |
データディレクトリのあるディスクの使用率。ディスク容量不足になるとさまざまな問題が発生するため,ディスクの増強やデータベースをほかのサーバに移動させるなどの対策が必要となる。 |
(b) 監視方法
-
監視テンプレートで提供しているDbCache Entries Usageアラームで監視できます。1日,1週間といった長い期間,使用率を記録し続けているため,ピークを特定したり,データベースキャッシュの値を増やすなどの対策が必要であるかどうかの目安になります。
定義例については,「1.3.3(1)(a) 監視テンプレート」を参照してください。
-
Lotus Dominoのデータベースは定期的なメンテナンスを怠ると,比較的簡単に肥大化し,データディレクトリを圧迫します。データディレクトリがあるディスクのディスク容量が不足すると,Lotus Dominoのデータベースはワークエリアを確保できないため,致命的な影響を受けることになります。データディレクトリの使用率を監視することで,致命的な状態になる前に対策できます。
定義例については,「1.3.3(1)(b) 監視テンプレート以外の定義例」を参照してください。
(2) ユーザー
(a) 概要
Lotus Dominoにログインしているユーザー数が多くなるにつれて,全体的なパフォーマンスは低下していきます。このため,ログインユーザー数を監視することにより,サーバを分けるなどの対策をする目安となります。
関連するレコードとフィールドを次の表に示します。
使用レコード |
使用フィールド |
値の見方(例) |
---|---|---|
PI_PI |
Users |
ログインユーザー数。ピークを特定したり,サーバを分けるなどの対策をする目安となる。 |
(b) 監視方法
-
監視テンプレートのLogin Usersアラームで監視できます。1日,1週間といった長い期間記録し続けているため,ピークを特定したり,サーバを分けるなどの対策をする目安になります。
定義例については,「1.3.3(2)(a) 監視テンプレート」を参照してください。
(3) メール
(a) 概要
Lotus Dominoはメールサーバとして使用されることが多いため,メールに関連したさまざまな問題が起きるおそれがあります。デッドメールや滞留メールの発生,配信エラーの発生などを監視することで,問題への早急な対策ができるようになります。
関連するレコードとフィールドを次の表に示します。
使用レコード |
使用フィールド |
値の見方(例) |
---|---|---|
PI_PI |
Mail Dead UserCustom |
配信先にも配信元にも送信できなくなったメール数。値が0でない場合,メールシステム上に問題がある。ネットワーク設定や接続文書の設定,ユーザー定義などに問題がないか見直す必要がある。 |
Mail Waiting UserCustom |
なんらかの理由によりメールキューに留まってしまっているメール数。そのメール以降にメールキューに投入された正常なメールも配信されなくなってしまうおそれがあるため,早急に対策する必要がある。 |
|
PI_PIML |
TotFailures |
配信エラーとなったメール数。システム上の設定に問題があるおそれがあるため,見直しをする必要がある。 |
PI_PIMK |
Expired Mails |
各メールデータベースに存在する期間(ユーザー指定可)を超過したメールの数。不要にディスク容量を圧迫しているデータベースを特定する手助けとなる。 |
(b) 監視方法
-
監視テンプレートで提供しているMail Dead Customアラームで監視できます。デッドメールは,配信先にも配信元にも送信できなくなったメールなので,デッドメールが発生している場合,メールシステム上に問題があります。ネットワーク設定や接続文書の設定,ユーザー定義などに問題がないか見直す必要があります。
定義例については,「1.3.3(3)(a) 監視テンプレート」を参照してください。
-
監視テンプレートで提供しているMail Waiting Customアラームで監視できます。滞留メールは,なんらかの理由によりメールキューに留まってしまっているメールです。滞留理由によっては,そのメール以降にメールキューに投入された正常なメールも配信されなくなってしまうため,アラームで監視することは早急に対策する上で非常に重要です。
定義例については,「1.3.3(3)(a) 監視テンプレート」を参照してください。
-
ディスク容量を不要に消費しているメールデータベースを特定したい
監視テンプレートで提供しているExpired Mail Status - Top 10 Databasesレポートで特定できます。レポート定義のランキング数を増やすことで,上位10位以降を表示することもできます。
定義例については,「1.3.3(3)(a) 監視テンプレート」を参照してください。
-
なんらかの理由により配信できなかったメール数を監視できます。配信できなかったメールは配信元に戻されるため,致命的な影響がでることはありませんが,システム上の設定に問題があるおそれがあり,見直しをする必要があります。
定義例については,「1.3.3(3)(b) 監視テンプレート以外の定義例」を参照してください。
(4) メモリー
(a) 概要
Lotus Dominoでは,メモリー使用量を監視することは重要です。メモリーが不足するとさまざまな問題が発生し,システムに多大な影響があります。また長期的に使用量を監視することで,メモリー増強などのプランニングの目安にもなります。
関連するレコードとフィールドを次の表に示します。
使用レコード |
使用フィールド |
値の見方(例) |
---|---|---|
PI_PI |
Mem Alloc Kbytes |
Lotus Dominoが確保しているメモリー数。慢性的に増加傾向にある場合,システム再起動などの対策が必要となる。 |
Mem Free Kbytes |
Lotus Dominoが動作しているマシンのメモリー空き容量。慢性的にメモリーが不足している場合,メモリー増強などの対策が必要となる。 |
(b) 監視方法
-
監視テンプレートで提供しているMem Alloc Kbytesアラームで監視できます。慢性的に増加傾向にある場合,メモリーリークしているおそれもあるため,システム再起動などの対策が必要になります。
定義例については,「1.3.3(4)(a) 監視テンプレート」を参照してください。
-
Lotus Dominoが動作しているマシンのメモリー空き容量を監視したい
メモリーが不足するとさまざまな問題が発生し,システムに多大な影響があるため,空き容量の監視は重要です。また,慢性的にメモリーが不足している場合,メモリー増強などの対策が必要になります。
定義例については,「1.3.3(4)(b) 監視テンプレート以外の定義例」を参照してください。
(5) 複製
(a) 概要
Lotus Dominoには複製機能があります。主にほかのLotus Dominoのサーバとの情報共有のために使用されますが,クラスタリングやバックアップにも使用されるため,正常に複製されているか監視することは重要です。複製のエラーを監視することで早期に対策できるようになります。
関連するレコードとフィールドを次の表に示します。
使用レコード |
使用フィールド |
値の見方(例) |
---|---|---|
PI_PI |
Repl Cluster Failed |
クラスタ間の複製が失敗した数※。ネットワーク設定,接続文書の設定,権限不足やディスク容量不足などさまざまな原因が考えられるため,見直しが必要となる。 |
Repl Failed |
ローカル複製,ほかのLotus Dominoサーバとの複製が失敗した数※。ネットワーク設定,接続文書の設定,権限不足やディスク容量不足などさまざまな原因が考えられるため,見直しが必要となる。 |
(b) 監視方法
-
監視テンプレートのRepl Cluster Failedアラームで監視できます。複製が失敗する要因としては,ネットワーク設定,接続文書の設定,権限不足やディスク容量不足などさまざまな原因が考えられるため,見直しが必要となります。
定義例については,「1.3.3(5)(a) 監視テンプレート」を参照してください。
-
ローカル複製,ほかのLotus Dominoサーバとの複製が正常に行われているか監視できます。複製のエラーにはネットワーク設定,接続文書の設定,権限不足やディスク容量不足などさまざまな原因が考えられるため,見直しが必要となります。
定義例については,「1.3.3(5)(b) 監視テンプレート以外の定義例」を参照してください。
(6) ヘルスチェック
(a) 概要
Lotus Dominoを運用中に,特定のサーバタスクなどがダウンする状況が発生する場合があります。このサーバタスクの稼働状態を監視して,ダウン時にアラーム通知することで早急な対応をする手助けになります。
関連するレコードとフィールドを次の表に示します。
使用レコード |
使用フィールド |
値の見方(例) |
---|---|---|
PI_PIHC |
Check Name |
監視対象にしているサーバタスクの識別子(HTTP,SMTP,POP3など)。 |
ResponseTime |
アクセスにかかった時間(ミリ秒単位)。(-1)が格納された場合,そのサーバタスクがダウンしていることを示す。 |
(b) 監視方法
-
サーバタスクがダウンすると一部,もしくはLotus Domino全体のサービス提供が停止してしまい,多大な影響を受けます。したがって,サーバタスクの稼働状況を監視することは非常に重要です。
定義例については,「1.3.3(6)(b) 監視テンプレート以外の定義例」を参照してください。
-
サーバタスクがダウンした場合,ほとんどの場合,Lotus Domino全体の再起動を実行しなければ正常に復旧できません。また,ある程度Lotus Dominoに対する知識がないと再起動できません。このため,PFM - Agent for Dominoは,Lotus Dominoの障害時に再起動を実行するアクションコマンド「notesrestart」を提供しています。このコマンドはLotus Dominoの強制終了機能も持っているため,フリーズ状態になっているLotus Dominoでも再起動できます。notesrestartコマンドについては,「9. アラームアクション用コマンド」を参照してください。
notesrestartコマンドを,サーバダウン稼働状況を監視するアラームと組み合わせることで,サーバタスクダウンを自動復旧させるアラーム定義を作成できます。
定義例については,「1.3.3(6)(b) 監視テンプレート以外の定義例」を参照してください。
(7) Notesログ監視
(a) 概要
Lotus Dominoの動作は,随時Notesログに記録されます。このNotesログは通常運用でも膨大な量になり,手動で確認するのは大変な作業です。Notesログ監視機能は,あらかじめ特定の検索文字列を指定することでNotesログをフィルタリングし,メッセージの発生をアラーム通知することができます。これにより早急に対応できます。
関連するレコードとフィールドを次の表に示します。
使用レコード |
使用フィールド |
値の見方(例) |
---|---|---|
PL_PLNL |
Message Text |
検索条件で指定したメッセージがNotesログに出力されている。メッセージ内容に対応する対策が必要となる。 |
(b) 監視方法
-
Notesログに特定のメッセージが出力されたことを監視したい
あらかじめ特定の検索文字列を指定することでNotesログをフィルタリングし,メッセージの発生をアラーム通知できます。詳細については,「5. Notes Log情報の収集」を参照してください。
また,定義例については,「1.3.3(7)(b) 監視テンプレート以外の定義例」を参照してください。