Document Filter for Text Search Version 3

[目次][用語][索引][前へ][次へ]

2.3.1 定義内容

コンフィグレーションファイルの定義内容を次に示します。

表2-1 コンフィグレーションファイルの定義内容

セクション エントリ 内容 設定値 デフォルト値
[SYSTEM] DOCFINPUTCODE テキスト抽出元のコード体系を示す識別子の文字列を指定します。
DOCFフィルタを使用して,テキスト形式ファイルからテキストを抽出する場合に有効になります。

  • SJIS
  • JIS
  • EUC
  • UTF8
自動判定
DOCFOUTPUTCODE 出力するテキスト抽出結果のコード体系を示す識別子の文字列を指定します。
  • SJIS
  • JIS
  • EUC
  • UTF8
SJIS
DOCFTIMEOUT テキスト抽出時の1ファイルあたりのタイムアウト時間を指定します。
  • 0〜86400(秒)
0の場合は,無制限になります。
0※1
DOCFDELETEMODE 詳細情報の保管方法を指定します。
詳細情報を残すかどうか,および残すファイルを指定します。

  • 0:保管しません。
  • 1:原因不明のエラーでAPIがテキスト抽出に失敗した場合に,詳細情報ファイルを残します。
  • 2:原因不明のエラーでAPIがテキスト抽出に失敗した場合に,詳細情報ファイルと一時ファイルを残します。
2
DOCFDAYTOLEAVE DOCFDELETEMODEが1または2の場合に,保管した詳細情報の保存期間を日数で指定します。
Document Filter for Text Search実行時に,本エントリで指定した日数よりも古い詳細情報が存在する場合は削除します。

  • 0〜90(日)
0の場合は無制限になります。
10
DOCFWORKDIR 一時フォルダを設定します。
このフォルダには抽出時に一時ファイルが格納され,詳細情報の保管指定に従って保管されます。
一時ファイルの出力先をフルパスで指定します。
指定できるパス名は,最大149バイトまでです。
<Document Filter for Text Searchのインストールフォルダ>\tmp※4
DOCFATTACHED 添付ファイル付き文書の扱いを指定します。
  • 0:未サポート文書と判断し,エラーとします。
  • 1:添付ファイルを含めてテキスト抽出し,正常終了します。
  • 2:元文書だけをテキスト抽出し,正常終了します。
1
DOCFDELWRNMODE 添付ファイルからのテキスト抽出がエラーとなった場合,またはDOCFATTACHEDに2を指定している場合に,ワーニングの詳細情報を残すかどうか,および残すファイルを指定します。
  • 0:詳細情報ファイルと一時ファイルを残しません。
  • 1:詳細情報ファイルを残します。
  • 2:詳細情報ファイルと一時ファイルを残します。
1
DOCFEXTMAX テキスト抽出サイズをKB単位で指定します。 1〜102,400(KB)の範囲で指定します。 5,120(KB)
[DOCFLIBRARYMAP] XXXX = XXXX,XXXX ファイルの拡張子に応じて使用するテキスト抽出ライブラリを分ける場合に,対応付けを指定します。
テキスト抽出ライブラリは,複数指定できます。
複数指定した場合は,先に指定したテキスト抽出ライブラリでテキスト抽出を実行し,テキスト抽出に失敗した場合に次のテキスト抽出ライブラリでテキスト抽出を実行します。
記述形式:
拡張子※2=ライブラリ種別[,ライブラリ種別…]
すべての拡張子,および拡張子なしを指定する場合は*(アスタリスク)を指定します。拡張子は大文字,小文字を区別しません。
*指定と拡張子の指定の両方がある場合は,指定した拡張子は*指定の対象外になります。

  • DMC
    DMCを指定した場合は,DMCフィルタを適用します。
  • MSIF
    MSIFを指定した場合は,32bit版のIFilterを適用します。
  • MS64
    MS64を指定した場合は,64bit版のIFilterを適用します。
  • DOCF
    DOCFを指定した場合は,DOCFフィルタを適用します。
  • DMTX
    DMTXを指定した場合は,DMTXフィルタを適用します。
* = DMC
txt = DMTX,DOCF
[DOCFTYPEMAP] XXXX = XXXX 対応している文書種別と同じ扱いにしたい場合に,仮定拡張子を指定します。※5

記述形式:
元拡張子=仮定拡張子
拡張子の対応をエントリ値に指定します。
抽出元の拡張子を元拡張子に,テキスト抽出ライブラリに渡す拡張子を仮定拡張子に指定します。

  • 拡張子
元拡張子には,「.」(ピリオド)も指定できます。
ピリオドの場合は,拡張子なしの指定になります。
拡張子の扱いを変更しません。※2,※3

注※1
標準コンフィグレーションファイルでは,600を設定しています。

注※2
拡張子は,大文字・小文字を区別しません。

注※3
拡張子および仮定拡張子は32バイトまで設定できます。

注※4
一時フォルダは,Document Filter for Text Search専用に設定してください。

注※5
1.3 対象ドキュメント」の表1-1に記載している文書種別を表す拡張子と異なる拡張子のファイルを対象とします。