4.4.3 全文検索インデクスの作成

ここでは,全文検索インデクスの作成方法について説明します。全文検索インデクスとは,全文検索機能付き文書クラスに追加した全文検索インデクス用プロパティに格納される,全文検索の対象になるテキストデータです。

全文検索インデクスは,どの時点で作成するか,また,どのレンディションタイプを持つ文書に対して作成するかによって,作成方法が異なります。

<この項の構成>
(1) 全文検索インデクスの作成時点
(2) レンディションタイプと全文検索インデクスの作成方法との対応
(3) 全文検索インデクスの作成方法

(1) 全文検索インデクスの作成時点

全文検索インデクスは,次のどちらかの時点で作成,登録できます。それぞれの特長について説明します。

差分インデクスの作成には,HiRDB Text Search Plug-inの差分インデクス作成機能を使用します。差分インデクス作成機能を使用する場合は,インデクス情報ファイルに差分インデクス作成を定義する必要があります。インデクス情報ファイルの定義については,マニュアル「DocumentBroker Version 3 システム導入・運用ガイド」を参照してください。差分インデクス作成機能の詳細については,マニュアル「HiRDB Text Search Plug-in」を参照してください。また,全文検索インデクスの遅延一括作成には,HiRDBのプラグインインデクスの遅延一括作成機能を使用します。全文検索インデクスを遅延一括作成する場合の環境設定および運用方法については,マニュアル「HiRDB システム運用ガイド」の,プラグインインデクスの遅延一括作成機能についての説明を参照してください。

(2) レンディションタイプと全文検索インデクスの作成方法との対応

DocumentBrokerでは,全文検索インデクスを持つすべての形式の文書に対して全文検索を実行できます。ただし,全文検索インデクスは,レンディションタイプで表される形式によって,作成方法が異なります。

レンディションタイプごとの全文検索インデクスの作成方法について説明します。

なお,バージョンなし文書およびバージョン付き文書の全文検索インデクスを作成する場合に,文書がマルチレンディション文書である場合には,マスタレンディションのレンディションタイプが対象になります。

なお,文書のコンテントから全文検索インデクスを作成した場合,レンディションタイプによって,可能な検索形式が異なります。レンディションタイプと,登録した文書のコンテントから作成した全文検索インデクスで可能な検索形式について,次の表に示します。

表4-4 全文検索文書として登録されるレンディションタイプと検索形式

レンディションタイプ検索形式
「MIME::text/」で始まるレンディションタイププレーンテキストの全文検索
MIME::application/x-edm-sgmlプレーンテキストの全文検索
構造指定検索
注※
ただし,XMLインデクスデータ作成機能を使用してインデクスデータを作成,登録したXML文書に対しては,構造指定検索も実行できます。

(3) 全文検索インデクスの作成方法

ここでは,作成する時期およびレンディションタイプごとの作成方法を考慮した,全文検索インデクスの作成方法について説明します。作成方法には,作成時期および文書のレンディションタイプに応じて,次の3通りの作成方法があります。

次の図に,それぞれの方法の概要を示します。

図4-1 全文検索インデクスの作成方法

[図データ]

それぞれの方法について説明します。

これによって,「文書B'.txt」の内容を基に全文検索インデクスが作成され,「文書B.doc」の全文検索インデクスとして登録されます。

注意事項
DocumentBrokerでは,CreateIndexメソッドで登録するファイルの内容とすでに登録されている文書の実体との対応は管理しません。CreateIndexメソッドの引数に指定したファイルの内容と登録されている文書の内容の対応については,ユーザプログラムで管理してください。