5.8.2 フィルタ情報定義ファイルの指定規則
ここでは,フィルタ情報定義ファイルの指定規則について説明します。
フィルタ情報定義ファイルは,任意の名称のファイルに文字コード指定で指定した文字コードで記述してください。また,フィルタ情報定義ファイルに記述した英大文字と英小文字は常に区別されます。
(1) フィルタ情報定義ファイルの指定形式
フィルタ情報定義ファイルの指定形式を次に示します。
<フィルタ情報> ::=〔<文字コード指定>〕<フィルタ内容指定>… <文字コード指定> ::= encoding=utf-8 <フィルタ内容指定> ::={<allow要素指定>|<deny要素指定>|<属性指定>| |<統合指定>|<空白文字指定>} <allow要素指定> ::= allow△<要素指定> <deny要素指定> ::= deny△<要素指定> <属性指定> ::= without attribute <統合指定> ::= absorb△<要素名> <空白文字指定> ::={trimdown ideographicspace | delete ideographicspace | delete space} <要素指定> ::=〔.〕{<要素名>|'*'|'?'}〔.{<要素名>|'*'|'?'}〕… <要素名> ::={<文字>|"'"<文字>"'"} 注 * : 0個以上の任意の要素 ? : 1個の任意の要素
なお,フィルタ情報定義ファイルを指定するときには次の点に注意してください。
-
文字コードは先頭行に指定し,2行目以降に必要なだけフィルタ内容を指定してください。このとき,個々の文字コード指定およびフィルタ内容指定は1行(1,023バイト以内)で記述してください。一つの指定を複数行に分割することはできません。
なお,行の先頭に「#」(シャープ)を記述すると,コメント行として扱われます。
-
「.」(ピリオド)で始まる要素指定は,最上位要素からの絶対要素指定となります。
ただし,最上位要素に対するフィルタリングはできません。
-
要素名に「.」が含まれる場合は,その要素名を「'」(アポストロフィ)で囲んでください。
- (例)
-
要素名「文書.章1」を指定する場合は,「'文書.章1'.下位要素」と記述します。
(2) フィルタリング指定項目の優先順位
フィルタリング指定項目の優先順位を次の表に示します。
順位 |
指定項目 |
---|---|
1 |
without attribute |
2※ |
allow,deny |
3 |
absorb |
4 |
delete ideographicspace,delete space |
5 |
trimdown ideographicspace |
- 注※
-
allowおよびdenyの優先順位については,「5.8.3 allowおよびdenyの指定例」を参照してください。
(3) フィルタ情報定義ファイル指定時の注意事項
-
absorb指定による統合処理は,allowまたはdeny指定による文書構造のフィルタリングのあとに実行されます。また,属性情報は常に削除されます。
-
フィルタリング機能を使用する場合は,フィルタリング機能を使用しない場合と比べてESIS-B形式データの生成に時間が掛かります。このときの処理に掛かる時間は,フィルタリング情報の量に依存します。
-
ファイルの内容は,文字コード指定で指定した文字コードで記述してください。文字コード指定を省略する場合は,シフトJIS文字コードで記述してください。
-
文字コード指定は,次の機能に影響を与えます。
-
フィルタ情報定義ファイル自体の解釈
-
allowおよびdenyの,要素指定および統合指定の要素名解釈
-
delete ideographicspace,delete space,およびtrimdown ideographicspace指定の結果
-
-
without attributeを指定した場合も,名前空間指定は削除できません。
-
名前空間指定を含んだ要素に対してdenyまたはabsorbを指定した場合,指定されていた名前空間指定が削除されます。また,削除された名前空間が指定されていた属性および要素は,デフォルトの名前空間が指定されます。