1.2.2 高い信頼性,可用性の求められるミッションクリティカルシステムで運用できます
Performance Managementはミッションクリティカルシステムでも,高い信頼性と可用性を維持したまま稼働監視できます。
- 〈この項の構成〉
(1) 監視対象の企業システムに負荷を掛けることなく稼働監視できます
Performance Managementは,データベースリソースや業務アプリケーションのプロセス稼働状況などの収集したパフォーマンスデータを監視マネージャーではなく,監視エージェントで収集し,Performance Management独自のデータベース(Storeデータベース)に蓄積します。ネットワーク上に,定期的に大量のパフォーマンスデータが送信されることがないため,ネットワークに不要な負荷を与えません。
また,収集した稼働監視データが肥大化するのを防ぐ機能を提供しています。そのため,ディスク容量を圧迫することなく限られたリソースの中で,必要な稼働情報だけを収集できます。
例を次に示します。
-
企業システムの規模やユーザーの利用形態などの特性に応じて,どのサーバの,どの監視項目の稼働情報を,どのタイミングで取得するかという詳細な設定ができる。
-
監視項目によっては,ある一定の時間ごとに要約したデータを収集できる。
-
過去のデータを自動的に上書きするため,一定のディスク容量の中で稼働監視を運用できる。
図1‒10 Performance Managementで収集した稼働監視データの流れ
Performance Managementのデータ管理の詳細については,「3.2 パフォーマンスデータを収集・管理する機能」を参照してください。
(2) 業務に影響が出る前にシステムの問題を管理者に知らせることができます
Performance Managementでは,監視対象のシステムが危険域に達したときにシステム管理者に通知するように設定できます。
監視対象システムの運用上の問題を早期に発見し,業務に影響が出る前に,問題に対処できます。
例えば,あるシステムのサーバでCPUの使用率が80%以上になったときに,システム管理者にEメールで連絡したり,ディスク容量が30%以下になったときに,コンソールでアイコンを点滅させてシステム運用者に知らせたりできます。
また,システムが危険域に達したときに任意のコマンドを自動で実行することもできます。
したがって,大規模システムでも少人数のメンバーで効率的に監視できます。
しきい値の超過で発行されるアラームの詳細については,「3.3 システムが危険域に達したときに警告する機能」を参照してください。
(3) 24時間365日システムを安定稼働で運用できます
Performance Managementをクラスタシステムや監視二重化で運用すると,システムに障害が発生した場合にも継続して業務を運用できる,信頼性の高いシステムが構築できます。
クラスタシステムでのPerformance Managementの構築と運用の詳細については,マニュアル「JP1/Performance Management 運用ガイド」の,クラスタシステムでの構築と運用について説明している章を参照してください。
監視二重化でのPerformance Managementの構築と運用の詳細については,マニュアル「JP1/Performance Management 運用ガイド」の,監視二重化の構築と運用について説明している章を参照してください。
(4) 稼働監視システム自身の障害を検知し,システムを安定稼働に導きます
Performance Managementでは,PFM - AgentまたはPFM - RMのサービス稼働状態やPFM - AgentまたはPFM - RMが稼働しているホストの稼働状態を監視できます。また,PFM - RMの監視対象ホストの稼働状態を監視できます。これをヘルスチェック機能と呼びます。ヘルスチェック機能によって,ホストの稼働状態を監視したり,監視対象がPFM - AgentやPFM - RMによって正しく監視されているかを確認したりできます。
監視結果はPFM - Web Consoleの次の画面で確認できます。
-
[エージェント階層]画面
-
[イベントモニター]画面
-
[イベント履歴]画面
ヘルスチェック機能では,稼働状態の監視結果を保存できるため,過去から現在までの稼働状態をレポートで確認できます。
また,稼働状態の監視結果にアラームを設定することで,ホストが正常に稼働していないことを検知したときやPFM - AgentまたはPFM - RMが正しく稼働していないことを検知したときにアラームイベントを発生させたり,Eメール送信などのアクションを実行させたりすることもできます。
なお,リモート監視の場合は,監視対象ホストが正常に稼働していないことを検知したときにアラームイベントを発生させたり,Eメール送信などのアクションを実行させたりできます。
さらに,Performance Managementシステムで,PFMサービスが何らかの原因で異常停止した場合に,PFMサービスを自動的に再起動する機能を用意しています。これをPFMサービス自動再起動機能と呼びます。
PFMサービス自動再起動機能の対象となるPFMサービスは,PFM - Managerサービス,Action Handlerサービス,PFM - AgentまたはPFM - RMサービスです。なお,Status Serverサービスは再起動の対象となりません。サービスの詳細については,「3.1 Performance Managementのサービス」を参照してください。
この機能によって,PFMサービスが異常停止した場合でも監視を継続できます。