2.5.3 ユーザLOB用RDエリアの容量の見積もり

ここでは,DocumentBrokerで使用するユーザLOB用RDエリアの容量の見積もりについて説明します。

<この項の構成>
(1) DocumentBrokerで使用するユーザLOB用RDエリア
(2) ユーザLOB用RDエリアが使用するデータベースリソースの所要量
(3) ユーザLOB用RDエリアの容量の見積もり方法

(1) DocumentBrokerで使用するユーザLOB用RDエリア

DocumentBrokerで使用するユーザLOB用RDエリアを次の表に示します。

表2-10 DocumentBrokerで使用するユーザLOB用RDエリア

ユーザLOB用RDエリアの種類説明
コンテンツ格納用RDエリア文書の実体であるコンテンツを格納します。
このRDエリアは必ず作成してください。
SGMLTEXTデータ格納用RDエリアコンテンツのテキストデータ(SGMLTEXT)を格納します。
HiRDB Text Search Plug-in,またはHiRDB XML Extensionを利用した全文検索機能を使用する場合には,このRDエリアを作成してください。
n-gramインデクス情報格納用RDエリアコンテンツのテキストデータのインデクス(n-gramインデクス)を格納します。
HiRDB Text Search Plug-in,またはHiRDB XML Extensionを利用した全文検索機能を使用する場合には,このRDエリアを作成してください。
全文検索機能付き文字列型プロパティのインデクス格納用RDエリア全文検索機能付き文字列型プロパティのデータのインデクスを格納します。
HiRDB Text Search Plug-in,またはHiRDB XML Extensionを利用した文字列型プロパティに対する全文検索機能を使用する場合には,このRDエリアを作成してください。

ユーザLOB用RDエリアに格納するデータについて説明します。

コンテンツ
Wordやテキストエディタなどのアプリケーションプログラムで作成されたバイナリ形式のファイルです。コンテンツは,dmaClass_ContentTransferクラスに対応する表に格納されます。
テキストデータ(SGMLTEXT)
コンテンツから抽出されたテキスト形式のデータです。テキストデータ(SGMLTEXT)は,dmaClass_DocVersionクラスに対応する表に格納されます。
なお,SGML TEXTは,HiRDB Text Search Plug-in,またはHiRDB XML Extensionでプレーンテキストを扱う抽象データ型(SGMLTEXT型)のデータのことです。詳細については,マニュアル「HiRDB Text Search Plug-in」,またはマニュアル「HiRDB XML Extension」を参照してください。
n-gramインデクス
テキストデータ(SGMLTEXT)の列に対するインデクスデータです。n-gramインデクスは,dmaClass_DocVersionクラスに対応する表に格納されます。
なお,n-gramインデクスは,文書中のn文字(n-gram)の出現位置を登録するインデクスのことで,HiRDB Text Search Plug-in,またはHiRDB XML Extensionで全文検索を実行するときに使用されます。詳細については,マニュアル「HiRDB Text Search Plug-in」,またはマニュアル「HiRDB XML Extension」を参照してください。
全文検索機能付き文字列型プロパティのデータのインデクス
全文検索機能付き文字列型プロパティのデータの列に対するインデクスデータです。全文検索機能付き文字列型プロパティのインデクスデータは,全文検索機能付き文字列型プロパティを追加するサブクラスに対応する表に格納されます。

(2) ユーザLOB用RDエリアが使用するデータベースリソースの所要量

ここでは,ユーザLOB用RDエリアの容量を見積もるための目安として,DocumentBrokerのクラス(表)ごとのデータサイズの見積もり方法を説明した一覧を示します。この一覧を参照して,どのようにRDエリアの容量を見積もりするかについては,「(3) ユーザLOB用RDエリアの容量の見積もり方法」で説明します。

ユーザLOB用RDエリア分のデータベースリソースの所要量を次の表に示します。

表2-11 ユーザLOB用RDエリア分のデータベースリソースの所要量

分類クラスデータサイズ(バイト)備考
コンテンツ格納用ContentTransferバージョンごとのRendition数×(バージョン付き文書ごとの平均バージョン数×バージョン付き文書数+バージョンなし文書数※1)×1文書に格納するファイルのファイルサイズの平均値文書の実体であるコンテンツデータを管理するクラス。
全文検索データ格納用全文検索機能付き文書クラス登録する文書のコンテンツのサイズに従って算出※2
全文検索機能付き文字列型プロパティのインデクス格納用全文検索機能付き文字列型プロパティを追加するサブクラスオブジェクトに設定する全文検索機能付き文字列型プロパティのデータのサイズに従って算出※2
注※1
バージョンなし文書は,バージョン付き文書の個々のバージョンに対応しない文書を指します。
注※2
登録する文書のコンテンツのサイズを求めて,マニュアル「HiRDB Text Search Plug-in」,またはマニュアル「HiRDB XML Extension」に従って算出する必要があります。

(3) ユーザLOB用RDエリアの容量の見積もり方法

ここでは,ユーザLOB用RDエリアの容量を見積もるための方法について説明します。ここで算出した値を基にして,実際に使用するディスク占有量を算出してください。ディスク占有量の算出方法については,マニュアル「HiRDB システム導入・設計ガイド」を参照してください。

ユーザLOB用RDエリアに格納するデータの容量は,登録するコンテンツのデータサイズや登録する文書の数などを考慮して,的確に見積もってください。

(a) コンテンツの容量

(2) ユーザLOB用RDエリアが使用するデータベースリソースの所要量」の表2-11の内容を参考にして,コンテンツ格納用RDエリアに格納するコンテンツの容量を算出してください。レンディションの数,ファイルの数,文書の論理構造など,文書の構成を考慮して,登録する文書の総数と文書のコンテンツの平均サイズから容量を算出してください。

(b) 全文検索機能で使用する容量

全文検索機能を使用するためには,全文検索機能付き文書クラスごとに,SGMLTEXTデータ格納用RDエリアとn-gramインデクス情報格納用RDエリアをそれぞれ作成する必要があります。全文検索機能を使用するためのRDエリアの容量の見積もりについては,マニュアル「HiRDB Text Search Plug-in」,またはマニュアル「HiRDB XML Extension」を参照してください。

なお,HiRDB Text Search Plug-in,またはHiRDB XML Extensionに登録する文書サイズは,登録する文書のコンテンツのサイズ(単位:バイト)に従って算出してください。

(c) 文字列型プロパティに対する全文検索機能で使用する容量

文字列型プロパティに対する全文検索機能を使用するためには,オブジェクトに設定する全文検索機能付き文字列型プロパティごとに,プロパティのデータのインデクスを格納するためのRDエリアを作成します。

文字列型プロパティに対する全文検索機能を使用するためのRDエリアの容量の見積もりについては,マニュアル「HiRDB Text Search Plug-in」,またはマニュアル「HiRDB XML Extension」を参照してください。

なお,HiRDB Text Search Plug-in,またはHiRDB XML Extensionに登録するプロパティのデータのサイズは,オブジェクトに設定する全文検索機能付き文字列型プロパティのデータのサイズと同じです。