Hitachi

 ボリューム管理 クイックリファレンス


3.1.2 容量削減機能について

メモ

Virtual Storage Platform G130は、容量削減機能をサポートしていません。

〈この項の構成〉

(1) 容量削減機能の特長と利点

容量削減機能は、ストレージシステムのコントローラによって格納データの圧縮および重複排除を実行する機能です。データ量の削減によって、搭載しているドライブの容量以上のデータが格納できるようになります。容量削減機能によってプールの空き領域を増やすことができるため、ユーザは製品ライフサイクルにおけるドライブ購入コストを減らすことができます。また、容量削減機能はすべてのドライブ種別のドライブで使用でき、暗号化機能とも併用できます。

容量削減機能による削減処理には、データの書き込みと同期して処理する方式と、データの書き込みと非同期で処理する方式があります。データの書き込みと同期して処理する方式を、インラインと呼びます。また、データの書き込みと非同期で処理する方式を、ポストプロセスと呼びます。これらの方式を総称して容量削減モードと呼びます。容量削減機能を使用する場合、インラインモードまたはポストプロセスモードを設定します。デフォルトは、インラインモードです。初期データ、新規書き込みデータ、および更新書き込みデータに対する、容量削減処理の実行方式(非同期または同期)を次に示します。

インラインモードとポストプロセスモードの違いは、新規書き込みデータに対する容量削減処理の実行タイミングです。インラインモードの場合、新規データの書き込みと同期して容量削減の処理が実行されます。ポストプロセスモードの場合、新規データの書き込みと非同期で容量削減の処理が実行されます。

容量削減機能の実行モード

初期データ※1の容量削減処理の方式

新規書き込みデータ

更新書き込みデータ

圧縮処理の方式

重複排除処理の方式

圧縮処理の方式

重複排除処理の方式

インラインモード

非同期

同期

同期※2

同期※3

非同期

ポストプロセスモード

非同期

非同期

非同期

同期※3

非同期

注※1

容量削減機能を設定したときに、仮想ボリュームにすでに書き込まれているデータです。初期データに対して、容量削減処理(初期容量削減処理)が実行されます。

注※2

大容量のデータを連続して書き込むといった、シーケンシャルI/Oのデータに適用されます。任意のファイルを不定期に更新するといった、ランダムI/Oのデータの重複排除処理は、ポストプロセスで実行されます。

注※3

圧縮済みデータに対して更新書き込みが実行された場合、書き込みデータの圧縮処理の方式を示しています。初期容量削減処理を実行する前の非圧縮データに対して更新書き込みが発生した場合、書き込まれたデータの圧縮処理はポストプロセスで実行されます。

すでに格納されているデータに対する容量削減の実行

ストレージシステムに容量削減機能を適用すると、データが格納されているページに対して、非同期で圧縮および重複排除処理が実行されます(初期容量削減処理)。容量削減機能の適用によるユーザデータの削減効果について、次の図に示します。

[図データ]

新規書き込みデータに対する容量削減の実行

新規に書き込まれるデータに対して容量削減する場合、インラインモード、またはポストプロセスモードが選択できます。

  • インラインモード

    仮想ボリュームにインラインモードの容量削減機能を適用すると、新規書き込みデータに対する圧縮および重複排除は、同期して実行されます。そのため、ポストプロセスモードに比べてI/O性能への影響が大きくなりますが、圧縮および重複排除に必要なプール容量を最小限に抑えることができます。インラインモードは、データマイグレーションの移行先ボリュームや、コピーペア作成時のセカンダリボリュームなど、シーケンシャルI/Oで新規データが書き込まれるケースでの適用を推奨します。なお、データ移行後やコピーペア作成後は、I/O性能への影響を抑えるためポストプロセスモードへの切り替えを推奨します。

  • ポストプロセスモード

    仮想ボリュームにポストプロセスモードの容量削減機能を適用すると、新規書き込みデータに対する圧縮および重複排除は、非同期で実行されます。このモードの場合、データの書き込み時に重複排除処理が行われません。そのため、重複排除処理の負荷によるI/O性能への影響を少なくできます。

[図データ]

上記の例は、データマイグレーションを実行したときのプール使用量の推移について、ポストプロセスモードを適用した場合のプールの使用量と、インラインモードを適用した場合のプールの使用量を示しています。なお、初期容量削減処理の性能(GB/h)よりも、新規データの書き込み速度(GB/h)が速い場合を想定しています。 インラインモードの場合、データの書き込みに同期して容量削減処理が実行されます。ポストプロセスモードの場合、データの書き込みとは非同期に容量削減処理が実行されます。このため、ポストプロセスモードの場合、一時領域分のプール容量が必要です。ただし、新規データの書き込み速度や更新データの有無などによって、一時領域として必要な容量は変化します。

メモ

ポストプロセスモードまたはインラインモードの設定は、RAID Managerで実行します。コマンドのオプションについては、RAID Managerコマンドリファレンスのraidcom add ldevまたはradcom modify ldevコマンドの-capacity_saving_modeオプションを参照してください。

(2) データ格納の仕組み

容量削減機能を使用した場合のデータの格納について、次の図に示します。

[図データ]

容量削減機能を使用する場合、仮想ボリュームに[圧縮]または[重複排除および圧縮]を設定します。[圧縮]が設定された仮想ボリュームにデータが書き込まれた場合、データ圧縮機能によってデータが圧縮されます。[重複排除および圧縮]が設定された仮想ボリュームにデータが書き込まれた場合、データ圧縮機能によってデータが圧縮されてから、重複排除機能によって重複データの削除と元データの重複排除用システムデータボリューム(データストア)への格納が行われます。なお、[重複排除および圧縮]を設定した仮想ボリュームを作成した場合、重複排除用システムデータボリューム(フィンガープリント)および重複排除用システムデータボリューム(データストア)が自動的に作成されます。また、すべての仮想ボリュームの設定が[重複排除および圧縮]から[無効]に変更された場合、すべての重複排除用システムデータボリュームは自動的に削除されます。

容量削減モードがインラインモードの場合、ホストからのデータ受信と同時に容量削減処理が実施されます。一方、ポストプロセスモードの場合、ホストからのデータは、プールの一時領域に格納されます。Dynamic Provisioningの場合、このデータの最後の更新から1時間が経過すると、データ格納領域に格納するデータとして容量削減処理が実施されます。プールの一時領域は、容量削減処理のあとで解放されます。

メモ
  • 重複排除用システムデータボリューム(データストア)は、容量削減の設定が[重複排除および圧縮]の仮想ボリュームが関連づけられているプール内で、重複データを格納するためのボリューム(Dynamic Provisioningの仮想ボリューム)です。このボリュームは、容量削減の設定が[重複排除および圧縮]の仮想ボリュームを作成する際に、自動的に作成されます。

  • 重複排除用システムデータボリューム(フィンガープリント)は、容量削減の設定が[重複排除および圧縮]の仮想ボリュームが関連づけられているプール内で、重複排除データの制御情報を格納するためのボリューム(Dynamic Provisioningの仮想ボリューム)です。このボリュームには、重複データの検索に必要な情報が格納されています。このボリュームは、容量削減の設定が[重複排除および圧縮]の仮想ボリュームを作成する際に、自動的に作成されます。

容量削減機能を使用するときに必要なプール容量は、容量削減処理済みデータの容量、容量削減機能の制御情報(メタデータ)の容量、および空き領域を足した容量です。メタデータについては、「3.1.6 容量削減機能の注意事項」を参照してください。

容量削減の設定を有効にすると、メタデータおよびガベージデータの全容量を格納するため、プール容量が消費されます。消費される容量は、プール容量の約10%の容量に相当します。プールの容量は、データ削減処理の使用状況に応じて動的に消費されます。なお、ホストからのデータの書き込み量が増えた場合、一時的にプール容量の10%を超えて消費されることがあります。しかし、データの書き込み量が少なくなるとガベージコレクション動作によってプール容量の10%程度の使用量になります。

メモ

ガベージデータは、データの更新によって不要になったデータです。容量削減機能を使用している場合、ガベージデータは次の処理が実行されたときに発生し、プール容量を消費します。

  • [圧縮]が設定された仮想ボリュームのデータを更新した場合

  • [重複排除および圧縮]が設定された仮想ボリュームで、ほかの仮想ボリュームと重複していないデータを更新した場合

ガベージデータによってプール使用量が増えた場合、ガベージコレクションを非同期で実行します。これによって、ガベージデータが回収されるため、プールの空き容量が増加します。

メモ

重複排除が有効な仮想ボリュームの容量削減設定を無効にすると、データの伸長処理によってプールの使用量が増加する可能性があります。容量削減設定を無効にする処理または削除処理を開始した場合、これらの処理は中断できません。

注意

プールの空き容量の割合が1%以下または空き容量が120GB以下になった場合、容量削減処理の中断や書き込み性能の低下が発生します。

(3) 圧縮機能

圧縮機能は、データの情報量を減らさずに、符号化によって別のデータサイズが小さいデータに変換する機能です。圧縮機能の圧縮アルゴリズムにはLZ4が使用されています。圧縮機能はDynamic Provisioningの仮想ボリュームごとに設定します。

(4) 重複排除機能

重複排除機能は、異なるアドレスに同じデータが書き込まれた場合、重複しているデータを削除する機能です。重複排除機能はDynamic Provisioningの仮想ボリュームごとに設定します。重複排除機能を設定すると、1つのプールに関連づけられた仮想ボリューム間で重複するデータが排除されます。なお、重複排除機能を設定した仮想ボリュームを作成すると、重複排除用システムデータボリューム(フィンガープリント)および重複排除用システムデータボリューム(データストア)が作成されます。重複排除用システムデータボリューム(フィンガープリント)には、プールに格納されているデータから重複データを検索するための検索テーブルが格納されています。1つのプールに対して、4個の重複排除用システムデータボリューム(フィンガープリント)が作成されます。重複排除用システムデータボリューム(データストア)には、重複データの元データが格納されています。1つのプールに対して4個の重複排除用システムデータボリューム(データストア)が作成されます。

また、すべての仮想ボリュームの設定が[重複排除および圧縮]から[無効]に変更された場合、すべての重複排除用システムデータボリュームは自動的に削除されます。

(5) 容量削減機能の適用についての注意事項

容量削減機能の適用によってドライブ購入コストの削減が見込まれる一方で、格納されているデータの性質やアクセスパターンによって、容量削減の効果が期待できないことがあります。次の表を参照してください。容量削減機能の適用により、メタデータやガベージデータでプール容量のうち10%を使用します。このため、容量削減機能は、容量削減率が1.2:1(20%)以上の効果が見込まれる環境に適用することを推奨します。

ガベージコレクションの能力以上の更新書き込みが継続して発生すると、キャッシュのライトペンディング率が増加し、システム全体に影響をおよぼす可能性があります。更新書き込みが継続的に発生する業務には、容量削減機能を適用しないことを強く推奨します。また、圧縮および重複排除済みのデータに対するI/O性能は低下します。容量削減機能を適用する場合、事前に十分な性能検証を行うことを推奨します。

データ種別、環境、または業務

適用する容量削減機能

説明

Microsoft Officeのデータ

重複排除および圧縮

同じファイルのコピーが多数存在するため、重複排除の効果がある。

仮想デスクトップインフラストラクチャ

(VDI:Virtual Desktop Infrastructure )

重複排除および圧縮

クローンのOS領域があるため、重複排除の効果が大きい。

データベース

圧縮

それぞれのブロックにユニークな情報があるため、重複排除の効果がない。

画像または映像データ

適さない

アプリケーションによってデータが圧縮される。

データバックアップまたはデータアーカイブ

重複排除および圧縮

バックアップデータ同士で、重複排除の効果がある。