文書収集コマンドを使用して文書を収集するための操作の流れを次に示します。
収集環境定義ウィザードで,文書コマンドのスクリプト(script.bat)が生成できます。文書収集コマンドを使用した文書の収集では,次に示す下線部分をカスタマイズして使用します。
"C:¥Program Files¥HITACHI¥Bib21¥Collector¥bin¥BIBcollectDoc.exe" -c Collector1 -m diff |
新規収集用,差分収集用および分割収集用のスクリプトごとにカスタマイズ方法を説明します。なお,文書収集コマンドの文法の詳細については,「付録C.3 文書収集コマンド(BIBcollectDocコマンド)の文法」を参照してください。
新規収集用のスクリプトは,-mオプションにnewを指定します。また,-fオプションに収集する文書数を指定するか,-tオプションに収集に掛かる時間を指定します。
分割の単位を6時間にした場合の新規収集用のスクリプトを次に示します。
"Bibliotheca21インストールディレクトリ¥Collector¥bin¥BIBcollectDoc" -c 収集環境名 -m new -t 0600 |
差分収集用のスクリプトは,-mオプションにdiffを指定します。また,-fオプションに収集する文書数を指定するか,-tオプションに収集に掛かる時間を指定します。
分割の単位を5,000件にした場合の差分収集用のスクリプトを次に示します。
"Bibliotheca21インストールディレクトリ¥Collector¥bin¥BIBcollectDoc" -c 収集環境名 -m diff -f 5000 |
分割収集用のスクリプトは,-mオプションにnextを指定します。また,-fオプションに収集する文書数を指定するか,-tオプションに収集に掛かる時間を指定します。
分割の単位を2時間30分にした場合の分割収集用のスクリプトを次に示します。
"Bibliotheca21インストールディレクトリ¥Collector¥bin¥BIBcollectDoc" -c 収集環境名 -m next -t 0230 |