プラグイン関数の処理

ここでは,テキストインデクサーによるプラグイン関数の処理を説明します。説明では,処理対象の文書が3件あり,RenditionTypeがそれぞれapplication/rtf,application/msword,application/pdfである場合を例とします。

RenditionType定義ファイルの定義内容

application/rtf/:filterE_0001
application/msword:filterE_0002
application/pdf:filterB

プラグイン環境設定ファイルの定義内容

[filterE_0001]
Library=C:¥IndexLoader¥libfilter_1.dll
[filterE_0002]
Library=C:¥IndexLoader¥libfilter_2.dll
 
[function]
RenditionType=application/rtf
Library=C:¥IndexLoader¥libfilter_1.dll
Function=usrGertProp1
Argv=usrProp_1
[function]
RenditionType=application/tif
Library=C:¥IndexLoader¥libfilter_2.dll
Function=usrGertProp2
Argv=usrProp1
Argv=usrProp2

テキストインデクサーの処理内容

テキストインデクサー(EDMTextIndexコマンド)を実行すると,テキストインデクサーは次の順序で処理を実行します。

  1. RenditionTypeがapplication/rtfである文書のインデクス登録処理を実行します。
    • テキストインデクサーがテキスト抽出プラグインライブラリ(/IndexLoader/libfilter_1.sl)を呼び出し,文書からテキストを抽出します。
    • 抽出したテキストをデータベースに登録します。
    • テキストインデクサーが引数にusrProp1の値を指定して,プロパティ値取得用プラグインライブラリ(/IndexLoader/libfilter_1.slのusrGetProp1())を呼び出します。
  2. RenditionTypeがapplication/mswordである文書のインデクス登録処理を実行します。
    • テキストインデクサーがテキスト抽出プラグインライブラリ(/IndexLoader/libfilter_2.sl)を呼び出し,文書からテキストを抽出します。
    • 抽出したテキストをデータベースに登録します。
  3. RenditionTypeがapplication/tifである文書のインデクス登録処理を実行します。
    • テキストインデクサーがDocumentFilter for Text Searchのテキスト抽出ライブラリを呼び出し,文書からテキストを抽出します。
    • 抽出したテキストをデータベースに登録します。
    • テキストインデクサーが引数にusrProp1,usrProp2の値を指定して,プロパティ値取得用プラグインライブラリ(/IndexLoader/libfilter_2.slのusrGetProp2())を呼び出します。