ここでは,テキストデータベースに登録するテキストファイルを自動的に抽出する機能(テキスト自動抽出機能)について説明します。
テキスト自動抽出機能には,次の2種類の機能があります。
ここでは,テキスト自動抽出機能を使用する場合の設定について説明します。必要な設定は,次の2種類です。
(1) 環境設定ユティリティでの設定
テキスト自動抽出機能を使用する場合,環境設定ユティリティでテキストの自動抽出を実行するための設定をする必要があります。環境設定ユティリティについては,「8.2 Document Managerの環境を設定する」を参照してください。
また,テキスト自動抽出時のタイムアウト時間を設定する場合は,autotxt.cfgファイルに設定する必要があります。
(2) 抽出対象リストファイルの編集
抽出対象リストファイルでは,テキストの抽出方法を指定します。
(a) 格納先
抽出対象リストファイルの格納先を示します。
(Document Managerの組み込み先のパス名)¥etc¥attxtlst.txt
(b) 指定内容
抽出対象リストファイルには,使用する機能に対応するイベントコードを指定します。指定できるイベントコードは次の2種類です。
(3) タイムアウト時間の設定
テキスト自動抽出を実行する場合,システムの負荷や処理時間を考慮してテキスト自動抽出を中断することができます。次の指定によって,テキスト自動抽出の時間を制御できます。
(a) 格納先
テキスト抽出管理ファイルの格納先を示します。
(Document Managerの組み込み先のパス名)¥etc¥autotxt.cfg
(b) 指定内容
TextAutoExtractTimeOut = テキスト自動抽出のタイムアウト時間
テキスト自動抽出時のタイムアウト時間を秒単位で指定します。
指定できる範囲は5~3600です。省略した場合は自動抽出時のタイムアウトを実行しません。
(4) 注意事項
表5-5 Document Filter for Text Searchがバージョン02-00時点でサポートしているファイルの種類
形式 | ファイルの種類(バージョン) |
---|---|
Excel | Excel 95,Excel 97,Excel 2000 |
Lotus 1-2-3 | R5J,1-2-3 97 |
1.2 | |
PowerPoint | PowerPoint 95,PowerPoint 97,PowerPoint 2000 |
RTF | 1.5 |
Word | Word 95,Word 97,Word 98,Word 2000 |
一太郎 | Version 8,Version 9 |