uCosminexus DocumentBroker Text Search Index Loader Version 3
![[目次]](figure/content.gif)
![[用語]](figure/gloss.gif)
![[索引]](figure/index.gif)
![[前へ]](figure/front.gif)
この節では,テキストインデクサーで使用できる文字コード種別について説明します。
テキストインデクサーで使用する文字コード種別は,DocumentBrokerサーバの文書空間で使用する文字コード種別に従います。そのため,テキストインデクサーで文字コード種別を設定する必要はありません。
DocumentBrokerサーバの文書空間で使用できる文字コード種別は次のどちらかです。
- Shift-JIS
- UTF-8(使用できる文字コードの範囲はUCS-2またはUCS-4です)
DocumentBrokerサーバの文書空間で使用する文字コード種別の設定および運用方法については,マニュアル「DocumentBroker Version 3 システム導入・運用ガイド」を参照してください。
- <この節の構成>
- (1) 文書空間の文字コード種別にUTF-8を設定した場合の注意事項
(1) 文書空間の文字コード種別にUTF-8を設定した場合の注意事項
DocumentBrokerサーバの文書空間の文字コード種別にUTF-8を設定した場合の注意事項を次に示します。
- ユーザが記述する次の項目は,印刷可能なASCIIコードで記述してください。
- コマンドに指定する引数
- テキストインデクサーで使用する,次のファイルの記載内容
環境設定ファイル,RenditionType定義ファイル,環境変数ファイル,定義ファイル,処理対象文書クラス定義ファイル,プラグイン環境設定ファイル
- テキストインデクサーで使用する,次のファイルのファイル名
定義ファイル,処理対象文書クラス定義ファイル
- 文書のテキスト情報の抽出に使用できるテキスト抽出ライブラリに制限があります。テキスト抽出ライブラリのサポート範囲の詳細については,「付録B 文書空間で使用する文字コード種別がUTF-8の場合のサポート範囲」を参照してください。
- メッセージテキストの挿入句に文書ファイル名が表示される場合,文書空間の文字コード種別の指定内容によって文書ファイル名の表示形式が異なります。文書ファイル名の表示形式の詳細については,「6.3.2(3) メッセージテキストの説明」を参照してください。
All Rights Reserved. Copyright (C) 2007, Hitachi, Ltd.
All Rights Reserved. Copyright (C) 2007, 2009, Hitachi Systems & Services, Ltd.