Bibliotheca21 Version 2 Standard
ここでは,同義語辞書を作成する方法について説明します。
同義語辞書とは,キーワードとなる単語と同じ意味を持つ単語(同義語)を定義しておく辞書です。
同義語辞書を作成してテキストデータベースに登録すると,キーワードの同義語を含む文書を検索できます。例えば,「パソコン」の同義語として「PC」および「パーソナルコンピュータ」を定義した辞書を作成します。それをテキストデータベースに登録しておくと,キーワード「パソコン」で検索したとき,「パソコン」,「PC」または「パーソナルコンピュータ」を含む文書を検索できます。
一つの同義語のグループに,かたかな,漢字,数字,英字といった種類の文字が混在している場合があります。これらの文字の種類を,文字種といいます。例えば,「アメリカ合衆国」という単語は,かたかな(アメリカ)と漢字(合衆国)の二つの文字種で構成されています。
同義語のグループは,グループ内の単語を文字種で分割したときに,その総数が1,000以下となるように定義してください。分割の総数を計算するときの注意事項を次に示します。
旧 ソビエト 連邦, ロシア 共和国 1 2 3 4 5 ‥‥分割の総数:5 |
同義語辞書は,任意のファイル名で任意の場所に作成します。ファイル名は,フルパスが200バイト以内になるように指定してください。
同義語辞書はテキスト形式で作成し,次の形式で記述します。
* ‥‥注釈行 *Bibliotheca21 同義語辞書 ‥‥注釈行 * ‥‥注釈行 パソコン,コンピュータ,PC ‥‥一つの同義語グループ アメリカ,USA,アメリカ合衆国, ‥‥次の行までが一つの同義語グループ America 一万円,\\10,000,壱萬円 ‥‥一つの同義語グループ |
同義語辞書は次の規則に従って記述してください。
All Rights Reserved. Copyright (C) 2007, 2009, Hitachi, Ltd.