Bibliotheca21 Version 2 Standard

[目次][用語][索引][前へ][次へ]

5.4.1 同義語辞書を作成する

ここでは,同義語辞書を作成する方法について説明します。

<この項の構成>
(1) 同義語辞書とは
(2) 同義語の定義規則
(3) 同義語辞書のファイル名と格納場所
(4) 同義語辞書の記述形式
(5) 同義語辞書の記述規則

(1) 同義語辞書とは

同義語辞書とは,キーワードとなる単語と同じ意味を持つ単語(同義語)を定義しておく辞書です。

同義語辞書を作成してテキストデータベースに登録すると,キーワードの同義語を含む文書を検索できます。例えば,「パソコン」の同義語として「PC」および「パーソナルコンピュータ」を定義した辞書を作成します。それをテキストデータベースに登録しておくと,キーワード「パソコン」で検索したとき,「パソコン」,「PC」または「パーソナルコンピュータ」を含む文書を検索できます。

(2) 同義語の定義規則

一つの同義語のグループに,かたかな,漢字,数字,英字といった種類の文字が混在している場合があります。これらの文字の種類を,文字種といいます。例えば,「アメリカ合衆国」という単語は,かたかな(アメリカ)と漢字(合衆国)の二つの文字種で構成されています。

同義語のグループは,グループ内の単語を文字種で分割したときに,その総数が1,000以下となるように定義してください。分割の総数を計算するときの注意事項を次に示します。

注意
  • ひらがなは文字種として数えません。
  • 長音およびハイフンは,直前にある文字と同じ文字種とします。直前に文字がない場合は,そのほかの扱いになります。
    例えば,「旧ソビエト連邦」と「ロシア共和国」を一つのグループとして定義した場合,分割の総数は次のように計算します。
     
     ソビエト 連邦, ロシア 共和国
    1     2      3      4     5      ‥‥分割の総数:5

(3) 同義語辞書のファイル名と格納場所

同義語辞書は,任意のファイル名で任意の場所に作成します。ファイル名は,フルパスが200バイト以内になるように指定してください。

(4) 同義語辞書の記述形式

同義語辞書はテキスト形式で作成し,次の形式で記述します。

記述形式
同義語,同義語〔,同義語〕…

記述例
 
*                           ‥‥注釈行
*Bibliotheca21 同義語辞書       ‥‥注釈行
*                           ‥‥注釈行
パソコン,コンピュータ,PC        ‥‥一つの同義語グループ
アメリカ,USA,アメリカ合衆国,  ‥‥次の行までが一つの同義語グループ
America
一万円,\\10,000,壱萬円          ‥‥一つの同義語グループ

(5) 同義語辞書の記述規則

同義語辞書は次の規則に従って記述してください。