フィルタプラグイン関数(dbrIdxTextFilter())
機能
全文検索用のテキストデータを抽出します。
形式
int dbrIdxTextFilter (
Idx_DocumentInfo *DocumentInfo,
unsigned long DataMode,
char *TargetData,
unsigned long TargetLength,
unsigned long MaxTextLength,
char *TextData,
unsigned long *TextLength,
unsigned long *OutFileDeleteFlag);
引数
戻り値
戻り値 | 内容 | テキストインデクサーの対処 |
---|---|---|
0 | 正常終了 | 処理を継続します。 |
正の値 | テキスト抽出に失敗しました。この値はユーザが定義します。 | ワーニングメッセージKMBV12252-Wを出力し,文書のインデクス登録処理を継続します。 書誌情報の登録を指定している場合は,書誌情報の登録処理を実行します。書誌情報を登録しないように指定している場合は,エラーとなった文書はテキスト抽出に失敗した文書として扱います。 |
負の値 | テキスト抽出に失敗しました。この値はユーザが定義します。 | エラーメッセージKMBV12308-Eを出力し,文書のインデクス登録処理を中断し,コマンドを終了します。エラーとなった文書は,テキスト抽出に失敗した文書として扱います。 |
注意事項
構造体の定義
struct IDX_DOCUMENTINFO {
char *pidxDVSubOIID; //処理対象文書クラスのOIID
char *pidxRenditionOIID; //処理対象文書(レンディション)のOIID
char *pidxRenditionType; //処理対象文書(レンディション)のRenditionType
char *pidxRetrievalName; //処理対象文書(コンテント)のRetrievalName
} Idx_DocumentInfo;