4.1.2 抽象データ型の選択

ここでは,Text Search Plug-inが提供する抽象データ型の選択方法について説明します。

<この項の構成>
(1) 提供する抽象データ型の相違点
(2) 非構造化文書を扱う場合に推奨する抽象データ型

(1) 提供する抽象データ型の相違点

Text Search Plug-in が提供する抽象データ型としてSGMLTEXT型とFREEWORD型があります。

これらの抽象データ型の相違点を次の表に示します。次の表を参照して使用する抽象データ型を選択してください。

表4-2 抽象データ型の相違点

項目SGMLTEXT型FREEWORD型
登録できるデータの種別構造化文書
  • SGML
  • XML(Preprocessing Library for Text Searchで作成したテキストデータ)
プレーン文書(文字列データ)
登録データ長の上限値5メガバイト32,000バイト(推奨255バイト)
登録データ格納用RDエリアユーザ用RDエリア(基表)
ユーザLOB用RDエリア(データ)
ユーザ用RDエリア(基表,データ)
全文検索○(構造名を指定した検索はできません)
概念検索×
登録データの出力原文書出力
SGML出力
プレーン出力
XML出力
原文書出力
対応するインデクス型NGRAM型IXFREEWORD型
インデクス格納用RDエリアユーザLOB用RDエリアユーザLOB用RDエリア
差分インデクス定義×
インデクス作成ルール追加機能×
インデクスファイル自動拡張機能○(設定をお勧めします)
(凡例)
○:使用できます
×:使用できません

(2) 非構造化文書を扱う場合に推奨する抽象データ型

構造を持たない文書(または文字列データ)は,SGMLTEXT型(表の作成時に指定する文書登録種別にプレーン文書を指定した場合)とFREEWORD型の両者に登録できます。ただし,次の条件を満たす場合,FREEWORD型にデータを登録することをお勧めします。