制御情報ファイルには,TSPIndexerコマンドの処理内容を定義します。制御情報ファイルはサンプルが提供されていますので,ご使用方法に合わせてカスタマイズしてください。
制御情報ファイルに指定する項目を次の表に示します。
表3-1 制御情報ファイルに指定する項目
項番 | 指定項目 | 指定内容 | 指定種別 | 複数指定 | 指定要否 |
---|---|---|---|---|---|
1 | TBL_IN | 入力表名 | 表名 | 不可 | 必須 |
2 | TBL_OUT | 出力表名 | 表名 | 不可 | 必須 |
3 | COL_INDOC_UNIQUE | 入力表ルのユニークキー列名および属性 | 列 | 可 | 必須 |
4 | COL_INDOC_DOC | 入力ドキュメントの格納列名 | 列 | 不可 | 必須 |
5 | COL_INDOC_FNAME | 入力ドキュメントファイル名の格納列名 | 列 | 不可 | 必須 |
6 | COL_INDOC_CTYPE | 入力ドキュメントのコンテントタイプ格納列 | 列 | 不可 | 必須 |
7 | COL_INDOC_MKSEARCH | インデクス作成指定情報列名 | 列 | 不可 | 必須 |
8 | COL_MKSTAT | インデクス作成状態列名 | 列 | 不可 | 必須 |
9 | COL_MNT | TSPIndexer保守情報列名 | 列 | 不可 | 必須 |
10 | COL_OUT_UNIQUE | 出力表のユニークキー列名および属性 | 列 | 不可 | 必須 |
11 | COL_OUT_TEXT | 全文検索用列名 | 列 | 不可 | 必須 |
12 | LEVEL_FORCE | 登録指定以外の文書,または登録に失敗した文書を登録するときに指定する | 数値 | 不可 | 必須 |
13 | FILE_ERROR | エラー情報ファイル | ファイル名 | 不可 | 必須 |
14 | TIME_EXEC | 実行時間指定 | 数値 | 不可 | 任意 |
15 | HIRDB_VERSION | 使用するHiRDBのバージョン | 文字列 | 不可 | 必須 |
16 | FILE_DOCFILTER_CONF | Document Filter for Text Searchのコンフィグレーションファイル名 | ファイル名 | 不可 | 任意 |
制御情報ファイルに指定する項目は,指定値の種別によって指定方法が異なります。次に,指定値の種別ごとに指定方法を説明します。
入力表名を指定します。表名は,「認可識別子.表識別子」の形式で指定します。認可識別子は省略できません。
TBL_IN=USER01.文書表
TBL_OUT="user02"."SearchTable"
列名,列属性,列長,および非ナル値制約オプションを指定します。指定する列の詳細については,「2.2 入力表および出力表の構成」を参照してください。なお,指定した値と実際の表の形式が不一致の場合はエラーとなります。また,代入,比較などの変換できるデータ型同士の場合でもエラーとなりますのでご注意ください。
設定項目=列名,列属性[,[列長][,notnull]]
列を指定する場合の注意事項を次に示します。
列属性 | 列長要否 |
---|---|
SMALLINT | 不要 |
INTEGER | 不要 |
CHAR | 必須 |
VARCHAR | 必須 |
NCHAR | 必須 |
NVARCHAR | 必須 |
MCHAR | 必須 |
MVARCHAR | 必須 |
BLOB | 必須 |
BINARY | 必須 |
SGMLTEXT | 不要 |
FREEWORD | 不要 |
COL_INDOC_UNIQUE=NUMBER,INTEGER
COL_INDOC_UNIQUE="name",CHAR,128
COL_INDOC_DOC=DOC,BLOB,1048576,notnull
COL_OUT_TEXT=TEXT_OUT,SGMLTEXT,,notnull
ファイル名をドライブ名からの絶対パスで指定します。ファイル名の前後を"(ダブルクォーテーション)で囲んでください。
FILE_ERROR="D:¥tmp¥error.log"
FILE_TRACE="D:¥trace¥trace.log"
制御情報ファイルの各設定項目について説明します。
入力情報格納列が存在する表名を指定します。指定方法については,「3.2.2(1)(a) 表を指定する場合」を参照してください。
抽出したテキストデータを格納する全文検索用列の存在する表名を指定します。指定方法については,「3.2.2(1)(a) 表を指定する場合」を参照してください。
出力表と入力表が同じ場合は,「TBL_IN」に指定した表名を指定してください。
入力表のユニークキー列名および属性を指定します。ユニークキー列は三つまで指定できます。三つを超えて指定した場合はエラーとなります。指定方法については,「3.2.2(1)(b) 列を指定する場合」を参照してください。
ユニークキー列を複数指定する場合は,この設定項目を複数行指定してください。複数のユニークキー列を指定した場合,ユニークキーの優先順位は指定順となります。列の詳細については,「2.2 入力表および出力表の構成」を参照してください。
全文検索用テキストデータを抽出する電子ドキュメントの実体が格納されている列名を指定します。指定方法については,「3.2.2(1)(b) 列を指定する場合」を参照してください。列の詳細については,「2.2 入力表および出力表の構成」を参照してください。
全文検索用テキストデータを抽出する電子ドキュメントのファイル名が格納されている列名を指定します。指定方法については,「3.2.2(1)(b) 列を指定する場合」を参照してください。列の詳細については,「2.2 入力表および出力表の構成」を参照してください。
全文検索用テキストデータを抽出する電子ドキュメントのコンテントタイプが格納されている列名を指定します。指定方法については,「3.2.2(1)(b) 列を指定する場合」を参照してください。列の詳細については,「2.2 入力表および出力表の構成」を参照してください。
インデクス作成指定情報列名を指定します。指定方法については,「3.2.2(1)(b) 列を指定する場合」を参照してください。列の詳細については,「2.2 入力表および出力表の構成」を参照してください。
インデクス作成状態列名を指定します。指定方法については,「3.2.2(1)(b) 列を指定する場合」を参照してください。列の詳細については,「2.2 入力表および出力表の構成」を参照してください。
TSPIndexer保守情報列名を指定します。指定方法については,「3.2.2(1)(b) 列を指定する場合」を参照してください。列の詳細については,「2.2 入力表および出力表の構成」を参照してください。
入力表のユニークキー列名および属性を指定します。ユニークキー列は三つまで指定できます。三つを超えて指定した場合はエラーとなります。指定方法については,「3.2.2(1)(b) 列を指定する場合」を参照してください。
ユニークキー列を複数指定する場合は,この設定項目を複数行指定してください。複数のユニークキー列を指定した場合,ユニークキーの優先順位は指定順となります。列の詳細については,「2.2 入力表および出力表の構成」を参照してください。
各列の属性および指定順序は,COL_INDOC_UNIQUEと同じにしてください。
全文検索列名を指定します。指定方法については,「3.2.2(1)(b) 列を指定する場合」を参照してください。列の詳細については,「2.2 入力表および出力表の構成」を参照してください。
テキスト抽出・全文検索列登録する行の実行レベルを指定します。次のどれかを指定してください。
障害発生時のエラー情報およびTSPIndexerコマンドの実行開始・実行完了メッセージを出力する,出力先ファイル名を指定します。ファイル名はドライブ名からの絶対パスで指定してください。なお,ファイルの出力先となるディレクトリは事前に作成しておく必要があります。指定方法については,「3.2.2(1)(c) ファイル名を指定する場合」を参照してください。
TSPIndexerコマンドを実行すると,指定されたファイルに情報が追加されます。
TSPIndexerコマンドの実行時間を,0~14400の分単位で指定します。デフォルトは60です。TSPIndexerコマンドは,ここで指定された時間だけ,登録処理を実行します。0を指定すると無制限と解釈され,すべての登録対象列に対して処理を実行します。
TSPIndexerコマンドで使用する,HiRDBのバージョンを指定します。6文字の半角英数字で指定してください。-(ハイフン)や/(スラッシュ)は指定できません。
また,バージョンアップなどでHiRDBのバージョンが変更になった場合は,この指定値も変更してください。
Document Filter for Text Searchの動作を定義したコンフィグレーションファイル名をドライブ名からの絶対パスで指定します。TSPIndexerコマンドがテキストデータを抽出するときに,Document Filter for Text Searchはここで指定したコンフィグレーションファイルの内容に従って動作します。指定しなかった場合は,Document Filter for Text Searchでの定義内容に従って動作します。また,コンフィグレーションファイルに指定されていない項目も,Document Filter for Text Searchでの定義内容に従います。
なお,指定したコンフィグレーションファイルをREADモードでOPENできなかった場合は,エラーメッセージKFGX2001-Eを出力して処理を中断します。
コンフィグレーションファイル(config.cfg)の設定例を次に示します。
[SYSTEM] DOCFTIMEOUT =600 [DOCFLIBRARYMAP] csv =DOCF ini =DOCF cfg =DOCF txt =DOCF csv =DOCF [DOCFTIPEMAP] csv =csv ini =ini cfg =cfg . =txt |