5.8.5 テキスト自動抽出機能の設定

ここでは,テキストデータベースに登録するテキストファイルを自動的に抽出する機能(テキスト自動抽出機能)について説明します。

テキスト自動抽出機能には,次の2種類の機能があります。

ここでは,テキスト自動抽出機能を使用する場合の設定について説明します。必要な設定は,次の2種類です。

<この項の構成>
(1) 環境設定ユティリティでの設定
(2) 抽出対象リストファイルの編集
(3) タイムアウト時間の設定
(4) 注意事項

(1) 環境設定ユティリティでの設定

テキスト自動抽出機能を使用する場合,環境設定ユティリティでテキストの自動抽出を実行するための設定をする必要があります。環境設定ユティリティについては,「8.2 Document Managerの環境を設定する」を参照してください。

また,テキスト自動抽出時のタイムアウト時間を設定する場合は,autotxt.cfgファイルに設定する必要があります。

(2) 抽出対象リストファイルの編集

抽出対象リストファイルでは,テキストの抽出方法を指定します。

(a) 格納先

抽出対象リストファイルの格納先を示します。

(Document Managerの組み込み先のパス名)¥etc¥attxtlst.txt

(b) 指定内容

抽出対象リストファイルには,使用する機能に対応するイベントコードを指定します。指定できるイベントコードは次の2種類です。

REGIST
文書を登録又は一括登録する時に,登録する文書の文書実体ファイルからテキストファイルを抽出する場合に指定します。
抽出には,Document Filter for Text Searchを使用します。
EXPORT
文書配布機能又はエクスポートユティリティ(ISexportコマンド)を実行する時に,テキストデータベースから既に登録されているテキストを抽出する場合に指定します。

(3) タイムアウト時間の設定

テキスト自動抽出を実行する場合,システムの負荷や処理時間を考慮してテキスト自動抽出を中断することができます。次の指定によって,テキスト自動抽出の時間を制御できます。

(a) 格納先

テキスト抽出管理ファイルの格納先を示します。

(Document Managerの組み込み先のパス名)¥etc¥autotxt.cfg

(b) 指定内容

TextAutoExtractTimeOut = テキスト自動抽出のタイムアウト時間

テキスト自動抽出時のタイムアウト時間を秒単位で指定します。

指定できる範囲は5~3600です。省略した場合は自動抽出時のタイムアウトを実行しません。

(4) 注意事項