Hitachi

uCosminexus Enterprise Search 運用ガイド


5.4.7 Groupmaxクローラー詳細情報画面

Groupmax固有のクローラー情報の詳細情報について説明します。他のクローラーと共通の設定については,「5.4.1 クローラー詳細情報の共通設定項目」を参照してください。

図5‒10 Groupmaxクローラー詳細情報画面

[図データ]

Groupmaxクローラー詳細情報画面の項目を次の表に示します。

表5‒20 Groupmaxクローラー詳細情報画面の項目

#

項目名

指定規則

説明

クロール対象機能

必須

クロールするGroupmaxの機能を指定します。

  • 電子掲示板

    電子掲示板に投稿された記事をクローリングする場合に指定します。

    Enterprise Searchでは電子掲示板上の一つの記事を一つのエントリーとして扱います。添付ファイルを持つ記事の場合は,添付ファイルも含めて一つのエントリーとします。

  • 電子会議室

    電子会議室の発言をクローリングする場合に指定します。

    Enterprise Searchでは電子会議室での一つの発言を一つのエントリーとして扱います。添付ファイルを持つ発言の場合は,添付ファイルも含めて一つのエントリーとします。

  • ファイル共有

    ファイル共有に格納されたファイルをクローリングする場合に指定します。

    Enterprise Searchでは一つのファイルを一つのエントリーとして扱います。ファイルがGroupmaxメールファイル(*.mlf)であり,メールファイルに添付ファイルが存在する場合は,添付ファイルのタイトルだけを含めて,一つのエントリーとします。

    クローリング対象ファイルの設定については,マニュアル「uCosminexus Enterprise Search 環境設定ガイド」を参照してください。

Groupmaxクローラーの登録が完了したあとに,クロール対象機能の変更はできません。

Groupmaxエクスポートフォルダー※1

必須

Groupmaxの電子掲示板/電子会議室/ファイル共有の内容ファイルがエクスポートされるフォルダーのパスを,UNC形式,または絶対パス形式で指定してください。

指定できる文字数は1,024文字※4までです。

フォルダー認証

必須

共通定義で登録したユーザー認証定義のタイトルが,ユーザー認証IDの昇順でプルダウンメニューに表示されます。

「フォルダー認証」に利用するユーザー認証定義を選択します。

利用しない場合は「使用しない」を選択します。

クローリング後にエクスポートフォルダーを削除するかの指定

必須

Groupmaxクローラーの登録が完了したあとに「Groupmaxエクスポートフォルダー」で指定したフォルダーに格納されている,電子掲示板/電子会議室/ファイル共有の内容ファイルを削除するかどうかを指定します。

  • 削除する

    指定したファイルを削除します。デフォルトの設定です。

  • 削除しない

    指定したファイルを削除しません。

フィルター※2※3

任意

電子掲示板,または電子会議室の添付ファイルのファイル名に対するフィルター式を入力します。なお,クロール対象機能にファイル共有を指定した場合は,この項目は表示されません。

入力できる文字数は1,024文字以内です。

  • 「を含む」

    クローリングする添付ファイルのファイル名を含むフィルター式を指定します。

    「を含む」のフィルター式にマッチするファイルパスは,クローリングする添付ファイルのファイル名に含めます。

  • 「を除く」

    クロールする添付ファイルのファイル名から除くフィルター式を指定します。

    「を除く」のフィルター式にマッチするファイルパスは,クローリングする添付ファイルのファイル名から除きます。

「を除く」,「を含む」の両方を指定した場合,「を除く」で指定された条件にマッチしない添付ファイルのファイル名のうち,「を含む」で指定された条件にマッチする添付ファイルのファイル名に対してクローリングを行います。

フィルターによりクローリングする添付ファイルのファイル名から除かれたファイルへは,アクセスを行いません。

注※1
  • Groupmaxからエクスポートされたファイルが正しくない場合は,クローリングエラーとなります。

  • 「Groupmaxエクスポートフォルダー」の指定先に複数のファイルが存在する場合,Enterprise Searchはファイル名の日付が昇順のファイルからクローリングを実行します。

注※2

フィルターは次の表に示す内容で,部分文字列マッチを確認します。

表5‒21 部分文字列マッチの内容

フィルター定義

意味

*(ワイルドカード)

任意の文字0文字以上として扱われます。

?(ワイルドカード)

任意の文字1文字として扱われます。

任意のシングルバイト文字

大文字と小文字は,同一文字として扱われます。

任意のマルチバイト文字(UTF-8)

そのまま比較します。

;(セミコロン)

セパレーターです。このセパレーターで複数のフィルターを指定できます。

注※3

フィルター式に何も指定しない場合は,次の表のとおりとなります。

表5‒22 フィルター式に何も指定しない場合

フィルター種類

デフォルト

備考

クローリングする添付ファイルのファイル名に含むフィルター式

なし

クローリングする添付ファイルのファイル名から除くフィルター式

*.gif;*.tif;*.tiff;*.jpg;*.jpeg;*.png;*.bmp

既定の画像ファイル

注※4

システム定義として設定可能な上限値です。実際の収集では,収集先システムの制限を受けます。Windowsファイルシステムの場合,収集可能なファイル名の長さは259バイト以下に制限されます。

注意事項
  • Enterprise Searchは指定先のGroupmaxエクスポートフォルダーのファイルからGroupmaxのユーザーのアクセス権や必要なデータを取得しています。ファイルのエクスポートを定期的に行わない場合,Groupmax上でのアクセス権とEnterprise Searchで表示する内容が一致しないおそれがあります。Groupmaxからのファイルのエクスポートは定期的に行う運用を推奨します。

  • クロール実行コマンド(IWSCrawler.bat)で-d(登録済みデータの削除)を指定し,かつ「エントリー保存期間」に「クローリング先から削除されたエントリーを削除する」を指定している場合,Enterprise Searchはクローリングを実行するごとに「Groupmaxエクスポートフォルダー」で指定したフォルダーのファイルを確認し,会議室の参照期限,発言の有効期限が過ぎた電子会議室,記事の提示期限が過ぎた電子掲示板,および前回までに収集したファイル共有のデータで未更新のデータを削除します。なお,ファイル共有のデータはコマンドでの削除を推奨します。詳細については「9.8 Groupmaxファイル共有クローラー削除コマンド」を参照してください。

〈この項の構成〉

(1) Groupmaxのエクスポートコマンド使用時の注意

Groupmaxのエクスポート機能で,エクスポートコマンドを使用する際の注意事項について説明します。

なお,Groupmaxのエクスポート機能の詳細についてはマニュアル「Collaboration - Forum システム管理者ガイド」,および「Collaboration - Bulletin board システム管理者ガイド」を参照してください。