Hitachi

JP1 Version 12 JP1/Performance Management 設計・構築ガイド


1.2.2 高い信頼性,可用性の求められるミッションクリティカルシステムで運用できます

Performance Managementはミッションクリティカルシステムでも,高い信頼性と可用性を維持したまま稼働監視できます。

〈この項の構成〉

(1) 監視対象の企業システムに負荷を掛けることなく稼働監視できます

Performance Managementは,データベースリソースや業務アプリケーションのプロセス稼働状況などの収集したパフォーマンスデータを監視マネージャーではなく,監視エージェントで収集し,Performance Management独自のデータベース(Storeデータベース)に蓄積します。ネットワーク上に,定期的に大量のパフォーマンスデータが送信されることがないため,ネットワークに不要な負荷を与えません。

また,収集した稼働監視データが肥大化するのを防ぐ機能を提供しています。そのため,ディスク容量を圧迫することなく限られたリソースの中で,必要な稼働情報だけを収集できます。

例を次に示します。

Performance Managementのデータ管理の詳細については,「3.2 パフォーマンスデータを収集・管理する機能」を参照してください。

(2) 業務に影響が出る前にシステムの問題を管理者に知らせることができます

Performance Managementでは,監視対象のシステムが危険域に達したときにシステム管理者に通知するように設定できます。

監視対象システムの運用上の問題を早期に発見し,業務に影響が出る前に,問題に対処できます。

例えば,あるシステムのサーバでCPUの使用率が80%以上になったときに,システム管理者にEメールで連絡したり,ディスク容量が30%以下になったときに,コンソールでアイコンを点滅させてシステム運用者に知らせたりできます。

また,システムが危険域に達したときに任意のコマンドを自動で実行することもできます。

したがって,大規模システムでも少人数のメンバーで効率的に監視できます。

図1‒11 システムの異常をシステム管理者にEメールで通知する例

[図データ]

しきい値の超過で発行されるアラームの詳細については,「3.3 システムが危険域に達したときに警告する機能」を参照してください。

(3) 24時間365日システムを安定稼働で運用できます

Performance Managementをクラスタシステムや監視二重化で運用すると,システムに障害が発生した場合にも継続して業務を運用できる,信頼性の高いシステムが構築できます。

図1‒12 クラスタシステムの運用例

[図データ]

図1‒13 監視二重化の運用例

[図データ]

クラスタシステムでのPerformance Managementの構築と運用の詳細については,マニュアル「JP1/Performance Management 運用ガイド」の,クラスタシステムでの構築と運用について説明している章を参照してください。

監視二重化でのPerformance Managementの構築と運用の詳細については,マニュアル「JP1/Performance Management 運用ガイド」の,監視二重化の構築と運用について説明している章を参照してください。

(4) 稼働監視システム自身の障害を検知し,システムを安定稼働に導きます

Performance Managementでは,PFM - AgentまたはPFM - RMのサービス稼働状態やPFM - AgentまたはPFM - RMが稼働しているホストの稼働状態を監視できます。また,PFM - RMの監視対象ホストの稼働状態を監視できます。これをヘルスチェック機能と呼びます。ヘルスチェック機能によって,ホストの稼働状態を監視したり,監視対象がPFM - AgentやPFM - RMによって正しく監視されているかを確認したりできます。

監視結果はPFM - Web Consoleの次の画面で確認できます。

ヘルスチェック機能では,稼働状態の監視結果を保存できるため,過去から現在までの稼働状態をレポートで確認できます。

また,稼働状態の監視結果にアラームを設定することで,ホストが正常に稼働していないことを検知したときやPFM - AgentまたはPFM - RMが正しく稼働していないことを検知したときにアラームイベントを発生させたり,Eメール送信などのアクションを実行させたりすることもできます。

図1‒14 ヘルスチェック機能による稼働状態監視の例(エージェント監視の場合)

[図データ]

なお,リモート監視の場合は,監視対象ホストが正常に稼働していないことを検知したときにアラームイベントを発生させたり,Eメール送信などのアクションを実行させたりできます。

さらに,Performance Managementシステムで,PFMサービスが何らかの原因で異常停止した場合に,PFMサービスを自動的に再起動する機能を用意しています。これをPFMサービス自動再起動機能と呼びます。

PFMサービス自動再起動機能の対象となるPFMサービスは,PFM - Managerサービス,Action Handlerサービス,PFM - AgentまたはPFM - RMサービスです。なお,Status Serverサービスは再起動の対象となりません。サービスの詳細については,「3.1 Performance Managementのサービス」を参照してください。

この機能によって,PFMサービスが異常停止した場合でも監視を継続できます。

図1‒15 PFMサービス自動再起動機能の概要

[図データ]