2.2.2 使用する文字コードによる機能差異について
HiRDBが文字コードutf-8でセットアップされた場合,Text Search Plug-inでも文字コードutf-8を使用できるようになります。この場合,文字 コードがutf-8であるXML文書,プレーン文書, およびFREEWORD型テキストが検索対象となります。ただし,FREEWORD型テキストについては,文字コード種別がMS-Unicodeである必要があります(MS-UnicodeはMicrosoft社のUnicodeです)。
また,使用する文字コードによって,Text Search Plug-inで使用できる機能が異なります。使用する文字コードによるText Search Plug-inの機能差を,表2-1,表2-2,および表2-3に示します。
機能 |
Shift-JISまたは EUC使用時 |
utf-8使用時 |
---|---|---|
単純文字列検索 |
○ |
○ |
検索タームを複数指定した検索(論理和または論理積使用) |
○ |
○ |
近傍検索 |
○ |
○ |
同義語展開検索 |
○ |
○ |
異表記展開検索 |
○ |
○ |
構造名を指定した検索 |
○ |
○ |
重み付き検索 |
○ |
○ |
概念検索 |
○ |
○ |
抽象データ型関数extracts |
○ |
△※ |
機能 |
Shift-JISまたは EUC使用時 |
utf-8(UCS2)使用時 |
utf-8(UCS4)使用時 |
---|---|---|---|
概念検索の使用 |
○ |
○ |
○ |
インデクス作成ルール追加機能 |
○ |
○ |
○ |
大小文字・全角文字半角文字統一機能 |
○ |
○ |
○ |
拗音統一機能 |
○ |
○ |
○ |
濁音統一機能 |
○ |
○ |
○ |
削除文字指定機能 |
○ |
○ |
○ |
文字単位インデクス作成機能 |
○ |
○ |
○ |
差分インデクス定義 |
○ |
○ |
× |
分割遅延登録時のインデクス定義 |
○ |
○ |
○ |
英文インデクス定義 |
○ |
○ |
× |
プラグイン種別 |
ユティリティ コマンド名 |
機能 |
Shift-JIS または EUC使用時 |
utf-8 (UCS2) 使用時 |
utf-8 (UCS4) 使用時 |
|
---|---|---|---|---|---|---|
文書検索プラグイン |
SGMLプラグイン |
レジストリの初期化 |
○ |
○ |
○ |
|
SGML定義情報の登録 |
○ |
○ |
○ |
|||
SGML定義情報の削除 |
○ |
○ |
○ |
|||
SGML定義情報の参照 |
○ |
○ |
○ |
|||
同義語辞書の登録 |
○ |
○ |
○ |
|||
同義語辞書の削除 |
○ |
○ |
○ |
|||
同義語辞書の移行 |
○ |
○ |
× |
|||
phssyndicbkup(UNIXの場合) |
同義語辞書のバックアップ |
○ |
○ |
○ |
||
n-gramインデクスプラグイン |
インデクス情報の取得 |
○ |
○ |
○ |
||
インデクスのインクリメンタル(最適化) |
○ |
○ |
× |
|||
文字列指定インクリメンタルユティリティ |
○ |
× |
○ |
|||
差分インデクスからMASTERインデクスへのマージ |
○ |
○ |
×※ |
|||
インデクスの拡張 |
○ |
○ |
×※ |
|||
インデクスの作成開始 |
○ |
○ |
○ |
|||
インデクス分割遅延登録開始/終了指定 |
○ |
○ |
○ |
|||
インデクス情報変更 |
○ |
○ |
○ |
|||
インデクス詰め替え |
○ |
○ |
○ |
|||
統計情報収集 |
○ |
× |
× |
|||
統計情報統合 |
○ |
× |
× |
|||
統計情報反映 |
○ |
× |
× |
|||
特徴ターム取得RDエリア指定 |
○ |
○ |
○ |
|||
文字列検索プラグイン |
FREE WORDプラグイン |
同義語辞書の登録 |
○ |
○ |
○ |
|
同義語辞書の削除 |
○ |
○ |
○ |
|||
同義語辞書の移行 |
○ |
○ |
× |
|||
phcsyndicbkup(UNIXの場合) |
同義語辞書のバックアップ |
○ |
○ |
○ |
||
IXFREE WORDプラグイン |
インデクス情報の取得 |
○ |
○ |
○ |
||
インデクスのインクリメンタル(最適化) |
○ |
○ |
× |
|||
文字列指定インクリメンタルユティリティ |
○ |
× |
○ |
|||
インデクスの拡張 |
○ |
○ |
×※ |
|||
インデクスの作成開始 |
○ |
○ |
○ |
|||
インデクス分割遅延登録開始/終了指定 |
○ |
○ |
○ |
|||
インデクス情報変更 |
○ |
○ |
○ |
|||
インデクス詰め替え |
○ |
○ |
○ |
- (凡例)
-
○:使用できる。
×:使用できない。
- 注※
-
文字コードutf-8(UCS4)使用時に次のユティリティを実行した場合,処理を行わないで正常終了します。
-
phnmerge(差分インデクスからMASTERインデクスへのマージ)
-
phnexpnd,phxexpnd(インデクスの拡張)
-