Hitachi

HiRDB 全文検索プラグイン HiRDB Text Search Plug-in Version 10


1.1.2 Text Search Plug-inの特長

Text Search Plug-inには,次の特長があります。

〈この項の構成〉

(1) 大量の文書または文字列データの管理

Text Search Plug-inで扱うデータには,文書(テキストデータ)の場合と,文字列データの場合があります。これらのデータは,HiRDBのデータベースに格納します。したがって,HiRDBの特長を生かし,高い検索性能や高い信頼性を持つシステムとして大量の文書または文字列データを管理できます。

(2) SGMLやXMLで書かれた構造を持つ文書の登録と検索

Text Search Plug-inでは,扱うデータが文書の場合,SGMLやXMLのように文書の構造を定義する言語で書かれたファイルを文書として登録できます。検索条件には,文書に定義した構造を利用できます。例えば,「文書中の,『見出し』として定義された構造内の文章中に『情報技術』という単語が含まれる文書を探す」などの検索ができます。

ただし,XML文書の場合は,Preprocessing Library for Text Searchを利用してText Search Plug-inで使用できるデータ形式に変換する必要があります。Preprocessing Library for Text Searchでデータを登録する方法については,マニュアル「Preprocessing Library for Text Search Version 2」を参照してください。

(3) 多彩な検索方法

Text Search Plug-inを利用した検索には,単語をキーワードにして検索する全文検索と,任意の文章または文字列から似た内容の文章を検索する概念検索とがあります。さらに,これら全文検索または概念検索に,さまざまな機能を追加することで,多様な検索を実現できます。

例えば,検索タームと意味が同じで表記の異なる情報を検索したり(同義語・異表記展開検索),検索条件を複数指定して,その条件の両方に一致する情報を検索したり(論理演算検索)できます。