Groupmax Document Manager Version 6 システム管理者ガイド
ここでは,テキストデータベースに登録するテキストファイルを自動的に抽出する機能(テキスト自動抽出機能)について説明します。
テキスト自動抽出機能には,次の2種類の機能があります。
- 文書を登録又は一括登録する時に,文書実体ファイルとして登録するファイルから自動的にテキストを抽出してテキストファイルを作成し,テキストデータベースに登録する機能
登録するファイルからのテキストの抽出にはDocument Filter for Text Searchを使用します。
- 文書配布機能やエクスポートユティリティ(ISexportコマンド)を使用してDocument Managerデータベースの文書を抽出する時に,抽出する文書に対応するテキストをテキストデータベースから抽出する機能
ここでは,テキスト自動抽出機能を使用する場合の設定について説明します。必要な設定は,次の2種類です。
- 環境設定ユティリティでの設定
- 抽出対象リストファイルの編集
- <この項の構成>
- (1) 環境設定ユティリティでの設定
- (2) 抽出対象リストファイルの編集
- (3) タイムアウト時間の設定
- (4) 注意事項
(1) 環境設定ユティリティでの設定
テキスト自動抽出機能を使用する場合,環境設定ユティリティでテキストの自動抽出を実行するための設定をする必要があります。環境設定ユティリティについては,「8.2 Document Managerの環境を設定する」を参照してください。
また,テキスト自動抽出時のタイムアウト時間を設定する場合は,autotxt.cfgファイルに設定する必要があります。
(2) 抽出対象リストファイルの編集
抽出対象リストファイルでは,テキストの抽出方法を指定します。
(a) 格納先
抽出対象リストファイルの格納先を示します。
(Document Managerの組み込み先のパス名)\etc\attxtlst.txt
(b) 指定内容
抽出対象リストファイルには,使用する機能に対応するイベントコードを指定します。指定できるイベントコードは次の2種類です。
- REGIST
- 文書を登録又は一括登録する時に,登録する文書の文書実体ファイルからテキストファイルを抽出する場合に指定します。
- 抽出には,Document Filter for Text Searchを使用します。
- EXPORT
- 文書配布機能又はエクスポートユティリティ(ISexportコマンド)を実行する時に,テキストデータベースから既に登録されているテキストを抽出する場合に指定します。
テキスト自動抽出を実行する場合,システムの負荷や処理時間を考慮してテキスト自動抽出を中断することができます。次の指定によって,テキスト自動抽出の時間を制御できます。
(a) 格納先
テキスト抽出管理ファイルの格納先を示します。
(Document Managerの組み込み先のパス名)\etc\autotxt.cfg
(b) 指定内容
TextAutoExtractTimeOut = テキスト自動抽出のタイムアウト時間
テキスト自動抽出時のタイムアウト時間を秒単位で指定します。
指定できる範囲は5〜3600です。省略した場合は自動抽出時のタイムアウトを実行しません。
(4) 注意事項
- テキスト自動抽出機能を使用する場合,抽出対象となるファイルは主ファイルだけです。関連ファイルの自動抽出は実行されません。従って,関連ファイルだけで構成された文書からはテキスト自動抽出が実行されません。
- 環境設定ユティリティでテキスト自動抽出機能を使用する定義をして,抽出対象リストファイルを作成しなかった場合,REGISTとEXPORTの両方を指定したものと仮定されて,テキスト自動抽出が実行されます。
- クライアントで文書を圧縮する指定をしている場合,テキスト自動抽出機能は実行されません。
- テキスト自動抽出機能を使用する場合は,十分なハードディスクの容量を確保するように,注意してください。
- イベントコードにREGISTを指定してテキスト自動抽出機能を使用する場合,文書の登録と同時にテキストの抽出,登録も実行されるため,テキスト自動抽出機能を使用しない場合に比べて文書の登録に時間が掛かります。
- イベントコードにREGISTを指定したテキスト自動抽出機能では,Document Filter for Text Searchを使用します。このため,テキストを抽出できるファイル形式については,Document Filter for Text Searchのサポートしている範囲に従います。
Document Filter for Text Searchがバージョン02-00時点でサポートしているファイルの種類を表5-5に示します。
表5-5 Document Filter for Text Searchがバージョン02-00時点でサポートしているファイルの種類
なお,Document Filter for Text Search使用時の注意事項及びサポートしているファイル形式の範囲については,Document Filter for Text Searchが提供しているReadmeを御確認ください。
形式 ファイルの種類(バージョン) Excel Excel 95,Excel 97,Excel 2000 Lotus 1-2-3 R5J,1-2-3 97 1.2 PowerPoint PowerPoint 95,PowerPoint 97,PowerPoint 2000 RTF 1.5 Word Word 95,Word 97,Word 98,Word 2000 一太郎 Version 8,Version 9
All Rights Reserved. Copyright (C) 2000, 2002, Hitachi, Ltd.