ここでは,Text Search Plug-inが提供する抽象データ型の選択方法について説明します。
Text Search Plug-in が提供する抽象データ型としてSGMLTEXT型とFREEWORD型があります。
これらの抽象データ型の相違点を次の表に示します。次の表を参照して使用する抽象データ型を選択してください。
表4-2 抽象データ型の相違点
項目 | SGMLTEXT型 | FREEWORD型 |
---|---|---|
登録できるデータの種別 | 構造化文書
| プレーン文書(文字列データ) |
登録データ長の上限値 | 5メガバイト | 32,000バイト(推奨255バイト) |
登録データ格納用RDエリア | ユーザ用RDエリア(基表) ユーザLOB用RDエリア(データ) | ユーザ用RDエリア(基表,データ) |
全文検索 | ○ | ○(構造名を指定した検索はできません) |
概念検索 | ○ | × |
登録データの出力 | 原文書出力 SGML出力 プレーン出力 XML出力 | 原文書出力 |
対応するインデクス型 | NGRAM型 | IXFREEWORD型 |
インデクス格納用RDエリア | ユーザLOB用RDエリア | ユーザLOB用RDエリア |
差分インデクス定義 | ○ | × |
インデクス作成ルール追加機能 | ○ | × |
インデクスファイル自動拡張機能 | ○ | ○(設定をお勧めします) |
構造を持たない文書(または文字列データ)は,SGMLTEXT型(表の作成時に指定する文書登録種別にプレーン文書を指定した場合)とFREEWORD型の両者に登録できます。ただし,次の条件を満たす場合,FREEWORD型にデータを登録することをお勧めします。