4.5.9 スコアオプション
スコアオプションでは,スコア付けした文書に対して次の指定ができます。
-
種文章に対して算出したスコアを基準(100点)として,検索結果の文書のスコアを相対的な値に正規化する指定
-
検索結果の件数を絞るためにスコアの下限値の指定
-
繰り返し構造に対するスコアの算出法の指定
なお,種文章に対して算出したスコアを基準とした場合(スコア正規化指定の場合)に,検索結果の中で種文章よりも適合度が高い文書のスコアは,種文章のスコアよりも高くなります。
スコアオプション指定の形式を次の図に示します。
適合度(スコア)の評価(算出)は,種文章から抽出された各検索用特徴タームに対して,次のような計算上の重みを付けて行います。
-
種文章とデータベースに登録されている文書の情報に基づいて算出された重み(Text Search Plug-inのMASTERインデクスに登録されている文書の情報が使用されます)
-
各検索用特徴タームがヒットした文書中に出現する割合に基づいて算出された重み
スコアの取得は,次の二つを用途によって使い分けます。
- スコア正規化指定
-
種文章に対して算出したスコアを基準(100点)とし,検索結果の文書のスコアを正規化します。検索結果には,100点を超える文書もあります。
また,正規化時には小数点以下のスコア値を切り捨てるため,結果としてスコア値が0点となる場合があります。
- スコア有効値指定
-
指定されたスコア以上の文書だけを検索結果とします。1〜2,147,483,647の値を指定できます。
ただし,NOT条件を含む検索実行時にはスコア値はナル値となるため,スコア有効値を指定しても無視されます。
- 指定例
-
構造名「文章」の下の「概要」に,種文章「XXX」から抽出された検索用特徴タームを含む。スコアは正規化によって算出し,スコア値が60以上のものを対象とする。
文章[概要{"XXX"}],norm,minscore=60
また,登録文書に繰り返し構造が多い場合は,次のオプションの指定を検討してください。