Hitachi

HiRDB XML拡張機能 HiRDB XML Extension Version 10


4.3.8 近傍条件指定

近傍条件指定では,二つの検索ターム(語句リスト)とそれらの距離条件,出現順序関係を指定します。それぞれの語句リスト中の検索タームのどれかがヒットした位置で,距離条件に当てはまるように近接している語句リストがヒットする文書を検索します。

距離条件として,距離には演算子と数値,距離単位には文字を表す'CHARACTERS'を使用します。これによって,二つの検索ターム間の文字数(距離)を検索条件にできます。

演算子は,指定距離に等しい,以上,および以下の3種類があり,等しい場合は =を,以上の場合は >=を,以下の場合は <=を指定します。

順序指定は,第一の語句リストと第二の語句リストのどちらが先に出現してもよいとする「ANY_ORDER」と,第一の語句リストの次に第二の語句リストが出現する順序を指定する「IN_ORDER」を選択できます。

近傍条件指定の形式を次の図に示します。

図4‒9 近傍条件指定の形式

[図データ]

指定例

文字列「COMPUTER」の同義語,アルファベット大小文字および全角半角文字展開と,文字列「ネットワーク」の同義語,アルファベット大小文字,カタカナ異表記,全角半角文字展開が20文字以下に近接して出現する(同義語辞書はUSR01)。

PROXIMITY(SYNONYM( USR01, "COMPUTER「","」AE"), <=20,

CHARACTERS,ANY_ORDER,SYNONYM( USR01, "ネットワーク「","」AKE"))

指定例

文字列「COMPUTER」と「SYSTEM」が10単語以下に近接して出現する。

PROXIMITY("COMPUTER", <= 10, WORDS, ANY_ORDER, "SYSTEM")

注意事項

近傍検索指定では,検索条件によってシステムに負荷を与えるおそれがあります。

環境定義ファイルに1文字近傍検索実行可否指定(phj_1gram_proximity_search)をすると,負荷を与えるおそれのある条件の検索を制限(エラーリターン)できます。