11.17.15 同義語一覧定義ファイルの指定規則
同義語一覧定義ファイルの指定規則について説明します。
(1) 同義語一覧定義ファイルの指定例
同義語辞書に次の2つの同義語グループを登録します。このときの同義語一覧定義ファイルの指定例を説明します。
-
データベース,データバンク,database
-
アプリケーションサーバ,APサーバ,application server
<同義語一覧定義ファイルの指定例>
データベース,データバンク,database↓ アプリケーションサーバ,APサーバ,application server↓
(凡例)↓:改行
- [説明]
-
-
「データベース」,「データバンク」,「database」のどれか1つを検索対象文字列に指定して検索を実行すると,「データベース」,「データバンク」,および「database」のすべての語句が同義語として一括検索されます。
-
「アプリケーションサーバ」,「APサーバ」,「application server」のどれか1つを検索対象文字列に指定して検索を実行すると,「アプリケーションサーバ」,「APサーバ」,および「application server」のすべての語句が同義語として一括検索されます。
-
(2) 同義語一覧定義ファイルの指定規則
-
1行に1つの同義語グループを指定します。
-
各同義語をコンマ( , )で区切って指定します。
-
各行の終わり(同義語グループの終わり)に改行を入力してください。また,同義語一覧定義ファイルの最後の行にも改行を入力してください。前記の例の場合,application serverの後ろに改行を入力する必要があります。
-
改行コードは,X'0A'(LF),X'0D0A'(CRLF),またはX'00'のどれかにしてください。
-
同義語の指定がない行(改行だけの行)があると,adbsyndictコマンドがエラーになります。
-
環境変数ADBLANGに指定している文字コードで同義語一覧定義ファイルを作成してください。
-
1つの同義語には,1〜1,000文字の文字列を指定できます。
-
1つの同義語グループには,2〜1,000の同義語を指定できます。
-
同義語グループは,1,000,000個まで指定できます。
-
水平タブX'09'(HT),改行文字X'0A'(LF),またはX'00'を含む同義語は登録できません。
-
二重引用符(")を囲み文字として指定することができます。同義語中に「,」がある場合は,囲み文字を指定してください。
-
同義語の文字列の前後の半角空白は削除されません。「△ab△c△d△△」と記述した場合,「△ab△c△d△△」が同義語として登録されます。△は,半角空白を示しています。
(3) 同義語一覧定義ファイルと同義語辞書の関係
検索条件や,検索対象の文書データの内容によっては,同義語辞書を複数作成して同義語辞書を使い分けることもできます。同義語辞書を複数作成する場合,同義語一覧定義ファイルは同義語辞書ごとに作成します。
例えば,次のような検索をする場合は,2つの同義語一覧定義ファイルを作成し,2つの同義語辞書を作成します。
-
データベースの一般的な用語が含まれている文章データを検索したい場合
-
データベースの種類を絞り込んで文章データを検索したい場合(例えば,リレーショナルデータベースに関する文章データを検索したい,NoSQLデータベースに関する文章データを検索したいなど)
- ■上記の1.の場合の同義語一覧定義ファイル(Terminology.txt)の指定
-
データベース,データバンク,database,リレーショナルデータベース,RDB,relational database,NoSQLデータベース,クラウドデータベース,ビッグデータデータベース↓
(凡例)↓:改行
この同義語一覧定義ファイルを使用して,同義語辞書Terminologyを作成します。データベースの一般的な用語が含まれている文章データを検索する際に,同義語辞書Terminologyを使用します。
- ■上記の2.の場合の同義語一覧定義ファイル(Terminology_detail.txt)の指定
-
リレーショナルデータベース,RDB,relational database↓ NoSQLデータベース,クラウドデータベース,ビッグデータデータベース↓
(凡例)↓:改行
この同義語一覧定義ファイルを使用して,同義語辞書Terminology_detailを作成します。リレーショナルデータベースに関する文章データを検索する場合や,NoSQLデータベースに関する文章データを検索する場合などに,同義語辞書Terminology_detailを使用します。