企業システムを安定稼働させ続けるためには,システム管理者は,大規模化,複雑化したシステムのデータベースやアプリケーションなどの障害を検知して適切に対処する必要があります。また,ネットワークやOSなどのリソースやデータベースの性能などの稼働情報を収集・分析して障害の発生を予見し,危険を未然に回避しながら運用管理をすることが必要になります。
ここでは,稼働監視をしていない場合の問題と,稼働監視で実現できることについて説明します。
(1) 稼働を監視していない場合の問題点
システム管理者は,システムのデータベースサーバやアプリケーションサーバに障害が発生した場合,稼働中のシステムへの影響を最小限にすることが必要です。そのため,サーバの稼働状態を監視して,システム障害を検知し,すぐに対処できる仕組みを検討しなければなりません。しかし,稼働監視していない場合,サーバでいったん障害が発生すると,システム利用者がシステムを使えないことによって業務に支障が出るおそれがあります。稼働を監視していない場合の問題点を次の図に示します。
図1-1 稼働を監視していない場合の問題点
(2) 稼働監視で実現できること
企業システムを24時間365日安定稼働させるために,システム管理者はデータベース,ネットワーク,OSなどのリソースを監視して,稼働中のシステムに十分なリソースが確保されているかを確認します。これによって,リソース不足によるシステムダウンを未然に回避できます。リソース監視の概要を次の図に示します。
図1-2 リソース監視の概要
また,システム管理者は業務アプリケーションサーバやデータベースサーバのトラフィック量やレスポンスタイムなどのパフォーマンスを監視して,監視結果(パフォーマンスデータ)をレポートに表示させることで,システム利用者が快適にシステムを利用できているかや,システムのボトルネックはどこにあるかなどを正しく把握できます。これによって,システムの状況に応じて計画的にリソースを投資できます。
図1-3 パフォーマンス監視の概要
このように,稼働監視をすると,大規模で複雑なシステムやミッションクリティカルのシステムを,安定稼働できます。また,システム全体のパフォーマンスデータを収集・分析して障害の発生を予見することで,危険を未然に回避しながら継続的に運用できます。
また,稼働監視をすると,システムのサービスレベルを定量的に把握できます。そのため,計画的なシステム投資や,ビジネスチャンスの損失を未然に防止することができます。