Hitachi

HiRDB 全文検索プラグイン HiRDB Text Search Plug-in Version 10


4.5.9 スコアオプション

スコアオプションでは,スコア付けした文書に対して次の指定ができます。

なお,種文章に対して算出したスコアを基準とした場合(スコア正規化指定の場合)に,検索結果の中で種文章よりも適合度が高い文書のスコアは,種文章のスコアよりも高くなります。

スコアオプション指定の形式を次の図に示します。

図4‒36 スコアオプション指定の形式

[図データ]

適合度(スコア)の評価(算出)は,種文章から抽出された各検索用特徴タームに対して,次のような計算上の重みを付けて行います。

スコアの取得は,次の二つを用途によって使い分けます。

スコア正規化指定

種文章に対して算出したスコアを基準(100点)とし,検索結果の文書のスコアを正規化します。検索結果には,100点を超える文書もあります。

また,正規化時には小数点以下のスコア値を切り捨てるため,結果としてスコア値が0点となる場合があります。

スコア有効値指定

指定されたスコア以上の文書だけを検索結果とします。1〜2,147,483,647の値を指定できます。

ただし,NOT条件を含む検索実行時にはスコア値はナル値となるため,スコア有効値を指定しても無視されます。

指定例

構造名「文章」の下の「概要」に,種文章「XXX」から抽出された検索用特徴タームを含む。スコアは正規化によって算出し,スコア値が60以上のものを対象とする。

文章[概要{"XXX"}],norm,minscore=60

また,登録文書に繰り返し構造が多い場合は,次のオプションの指定を検討してください。

代表スコアオプション指定

構造化文書での概念検索のスコア値は,ヒットした構造すべてのスコア値の合計となります。このため,繰り返し構造を指定した検索の場合,繰り返し構造数の多い文書のスコア値が極端に高くなることがあります。このオプションを指定すると,ヒットした構造の中で最もスコア値が高い構造のスコア値を代表として,その文書のスコア値にできます。

なお,このオプションは,検索対象が繰り返し構造でない場合でも有効です。

指定例

繰り返し構造「章」を対象に代表スコア指定で概念検索する

書誌[章{"種文章"}],repres