Groupmax Document Manager Version 6 システム管理者ガイド
同義語を条件にして全文検索する場合,同義語辞書データファイルを作成して同義語辞書を作成します。ここでは,同義語辞書データファイルの形式について説明します。
なお,全文検索サーバとしてBibliotheca2 TextSearchを御使用の場合は,Bibliotheca2 TextSearch Dictionaryをインストールしてください。また,同義語辞書については,マニュアル「Bibliotheca2 TextSearch Version 2 システム管理者ガイド」を参照してください。
- <この節の構成>
- (1) 同義語辞書データファイルの作成
- (2) 同義語辞書データファイルの記述形式
同義語を定義するファイルを,同義語辞書データファイルといいます。同義語展開をして全文検索をするには,このファイルに展開する内容を定義しておきます。
同義語辞書データファイルの作成後は,TextSearch DBユティリティを使用して同義語辞書を作成します。同義語辞書の作成については,「8.35.7 同義語辞書の作成」を参照してください。
(2) 同義語辞書データファイルの記述形式
(a) 形 式
同義語,同義語〔,同義語〕…←
〔同義語,同義語〔,同義語〕…←〕
(凡例)
←:改行コード
(b) 指定方法
同義語になる単語を「,」(半角コンマ)で区切って記述します。さらに,一つの同義語のグループを,改行コードで区切ります。
(c) 注意事項
- 同義語は,シフトJISコードで記述してください。
- 一つの同義語のグループには,2語以上の単語を記述してください。
- 一つの単語は96バイト以内で記述してください。
- 先頭文字に「*」(半角アスタリスク)を記述すると,注釈行として扱われるため同義語として扱われません。
- 行の末尾が「,」(半角コンマ)で終了している場合,行が継続しているものとして扱われます。
- 「¥」を同義語とする場合は,「¥¥」と記述してください。
- 1行は,1,000バイト以下で記述してください。
- 同義語辞書データファイルは,1メガバイト以内で記述してください。
- 空白行(半角スペース,水平タブと改行コードで構成される行又は,改行コードだけの行)は,無視されます。
行の先頭部分に空白(半角スペース,水平タブ)を記述している場合,空白以外の文字が現れたところからデータとして扱われますが,データ途中に空白が現れた場合,それ以降から行の末尾までのデータは注釈として扱われます。
(d) 記述例
同義語辞書データファイルの記述例を,次に示します。
「コンピュータ」の同義語を「パソコン」「PC」「Computer」とする
「アメリカ」の同義語を「USA」「アメリカ合衆国」とする
「一万円」の同義語を「¥10,000」「壱万円」とする
* *同義語辞書の作成例 * コンピュータ,パソコン,PC, Computer アメリカ,USA,アメリカ合衆国 一万円,¥10,000,壱万円
All Rights Reserved. Copyright (C) 2000, 2002, Hitachi, Ltd.