目次へ飛ぶ   原文表示:
W3C Home

XML パス言語 (XPath) 1.0

W3C 勧告 1999年 11月 16日

この版:
http://www.w3.org/TR/1999/REC-xpath-19991116 XML 版 HTML 版
最新版:
http://www.w3.org/TR/xpath
以前の版
http://www.w3.org/TR/1999/PR-xpath-19991008
http://www.w3.org/1999/08/WD-xpath-19990813
http://www.w3.org/1999/07/WD-xpath-19990709
http://www.w3.org/TR/1999/WD-xslt-19990421
編集
James Clark <jjc@jclark.com>
Steve DeRose (Inso Corp. and Brown University) <Steven_DeRose@Brown.edu>
Copyright © 1999 W3C® (MIT, INRIA, Keio), All Rights Reserved. W3C liability, trademark, document use and software licensing rules apply.

要約

XPath は XSLT と XPointer からの利用を念頭に置いて設計された、 XML 文書の一部分をアドレス指定するための言語である。 XPath is a language for addressing parts of an XML document, designed to be used by both XSLT and XPointer.

この文書の位置付け

この文書は、W3C のメンバおよびその他の関係者が評価し、W3C 勧告 として担当の責任者が承認したものである。 今後変更される可能性はなく、他の文書において参考資料として使用したり、あるいは基準となる参考文献として引用することができる。 勧告の策定にあたって W3C が担う役割は、この仕様への注目を集めて広く普及させることにある。 これにより Web の機能性と相互運用性を向上させることができる。 This document has been reviewed by W3C Members and other interested parties and has been endorsed by the Director as a W3C Recommendation. It is a stable document and may be used as reference material or cited as a normative reference from other documents. W3C's role in making the Recommendation is to draw attention to the specification and to promote its widespread deployment. This enhances the functionality and interoperability of the Web.

この仕様の正誤表は http://www.w3.org/1999/11/REC-xpath-19991116-errata から入手できる。 【当訳にはこのページ更新日までの修正が取り込まれています】 The list of known errors in this specification is available at http://www.w3.org/1999/11/REC-xpath-19991116-errata.

この仕様に関するコメントは www-xpath-comments@w3.org 宛に。 コメントの アーカイブ も利用できる。 Comments on this specification may be sent to www-xpath-comments@w3.org; archives of the comments are available.

この仕様の正式な版は英語版のみになる。 各国語の翻訳版は http://www.w3.org/Style/XSL/translations.html を参照。 The English version of this specification is the only normative version. However, for translations of this document, see http://www.w3.org/Style/XSL/translations.html.

W3C 勧告の一覧その他の技術文書は http://www.w3.org/TR から入手できる。 A list of current W3C Recommendations and other technical documents can be found at http://www.w3.org/TR.

この仕様は XSL Working Group と XML Linking Working Group による協同成果であり、 W3C Style activity および W3C XML activity の一部でもある。 This specification is joint work of the XSL Working Group and the XML Linking Working Group and so is part of the W3C Style activity and of the W3C XML activity.


1 概要

XPath は、 XSL Transformations [XSLT] と XPointer [XPointer] が共有する機能に共通の構文と意味内容を盛り込む試みの成果である。 XPath の主な目的は XML [XML] 文書の一部分をアドレス指定する所にある。 これをサポートするため、 XPath では文字列, 数, 真偽値を操作する基本機能も提供している。 URI や XML 属性値の内部での利用を容易にするため、 XPath は XML 構文を利用しないコンパクトな構文を用いる。 XPath は XML 文書の表面的な構文ではなく XML 文書の抽象的な論理構造の上で処理を行う。 XPath という名称は、 XML 文書の階層構造を辿る際に URL と同様のパス表記法を採用している所から命名されている。 XPath is the result of an effort to provide a common syntax and semantics for functionality shared between XSL Transformations [XSLT] and XPointer [XPointer]. The primary purpose of XPath is to address parts of an XML [XML] document. In support of this primary purpose, it also provides basic facilities for manipulation of strings, numbers and booleans. XPath uses a compact, non-XML syntax to facilitate use of XPath within URIs and XML attribute values. XPath operates on the abstract, logical structure of an XML document, rather than its surface syntax. XPath gets its name from its use of a path notation as in URLs for navigating through the hierarchical structure of an XML document.

アドレス指定の機能に加え、 XPath は、照合(ノードがパターンに合致するかどうかのテスト)に利用できるサブセットが本来的に備わるように設計されている。 XPath のこのような利用については XSLT で述べられている。 In addition to its use for addressing, XPath is also designed so that it has a natural subset that can be used for matching (testing whether or not a node matches a pattern); this use of XPath is described in XSLT.

XPath は XML 文書をノードのツリーとしてモデル化する。 要素ノード, 属性ノード, テキストノードなど、ノードにはいろいろな型がある。 XPath はこれらのノード型のそれぞれに対し 文字列値 を計算する方法を定める。 一部のノード型は名前も持つ。 XPath は XML 名前空間 [XML Names] を完全にサポートする。 ノードの名前は局所部( local part )と( null も含む)名前空間 URI のペアからなる。 これは 展開名 と呼ばれる。 これらのデータモデルについては [5 データモデル] の中で詳細に述べる。 XPath models an XML document as a tree of nodes. There are different types of nodes, including element nodes, attribute nodes and text nodes. XPath defines a way to compute a string-value for each type of node. Some types of nodes also have names. XPath fully supports XML Namespaces [XML Names]. Thus, the name of a node is modeled as a pair consisting of a local part and a possibly null namespace URI; this is called an expanded-name. The data model is described in detail in [5 Data Model].

XPath の構文構造の主体になるのは式である。 式は生成規則 Expr に一致する。 式が評価されると、次の4つの基本型のうちのいずれかのオブジェクトが生成される。 The primary syntactic construct in XPath is the expression. An expression matches the production Expr. An expression is evaluated to yield an object, which has one of the following four basic types:

式は文脈( context )に基づいて評価される。 XSLT と XPointer では XPath 式を評価する際の文脈の決定方法を規定している。 文脈は次のものから構成される: Expression evaluation occurs with respect to a context. XSLT and XPointer specify how the context is determined for XPath expressions used in XSLT and XPointer respectively. The context consists of:

文脈位置の値は、常に文脈サイズの値以下となる。 The context position is always less than or equal to the context size.

変数束縛は変数名から変数値への対応付けからなる。 変数の値は1つのオブジェクトであり、式の値として生じ得る任意の型を持ち得る。 また、ここでは規定されていない追加の型も持ち得る。 The variable bindings consist of a mapping from variable names to variable values. The value of a variable is an object, which can be of any of the types that are possible for the value of an expression, and may also be of additional types not specified here.

関数ライブラリは関数名から関数への対応付けからなる。 それぞれの関数は 0 個以上の引数をとり、 1 個の結果を返す。 この文書では、XPath のどの実装も必ずサポートしなければならないコア関数ライブラリを定める( [4 コア関数ライブラリ] 参照)。 コア関数ライブラリに属する関数については、引数や結果の返り値は上の4つの基本型のいずれかになる。 XSLT と XPointer のいずれも、追加の関数を定義して XPath を拡張している。 これらの関数の中には、4つの基本型に対して処理を行うものもあれば、 XSLT や XPointer で定義された追加のデータ型に対して処理を行うものもある。 The function library consists of a mapping from function names to functions. Each function takes zero or more arguments and returns a single result. This document defines a core function library that all XPath implementations must support (see [4 Core Function Library]). For a function in the core function library, arguments and result are of the four basic types. Both XSLT and XPointer extend XPath by defining additional functions; some of these functions operate on the four basic types; others operate on additional data types defined by XSLT and XPointer.

名前空間宣言は、接頭辞から名前空間 URI への対応付けからなる。 The namespace declarations consist of a mapping from prefixes to namespace URIs.

部分式を評価する際に利用される変数束縛, 関数ライブラリ, 名前空間宣言は、その部分式を含む式を評価する際に利用される文脈のものと常に同じである。 しかしながら、部分式を評価する際に利用される文脈ノード, 文脈位置, 文脈サイズについては、その部分式を含む式を評価する際に利用される文脈のものから変化し得る。 いくつかの種類の式は文脈ノードを変更する。 文脈位置や文脈サイズを変更するのは述語のみになる( [2.4 述語] 参照)。 式の評価について述べる際は、文脈ノード, 文脈位置, 文脈サイズが部分式の評価によって変化する場合は常にその変化内容について明示的に定められる。 これらについて何も述べていなければ、それらは変更されない。 The variable bindings, function library and namespace declarations used to evaluate a subexpression are always the same as those used to evaluate the containing expression. The context node, context position, and context size used to evaluate a subexpression are sometimes different from those used to evaluate the containing expression. Several kinds of expressions change the context node; only predicates change the context position and context size (see [2.4 Predicates]). When the evaluation of a kind of expression is described, it will always be explicitly stated if the context node, context position, and context size change for the evaluation of subexpressions; if nothing is said about the context node, context position, and context size, they remain unchanged for the evaluation of subexpressions of that kind of expression.

多くの場合、 XPath 式は XML 属性の中で記述される。 この節で規定する文法は、 XML 1.0 による正規化後の属性値に適用される。 従って、例えば文法内の文字 < は、そのまま XML ソース内に < を記述してはならず、 &lt; のように XML 1.0 の規定に従ってクオートしなければならない。 式内部のリテラル文字列は一重引用符または二重引用符で括られるが、これらの引用符は XML 属性値を括るためにも用いられる。 式内部の引用符は、 XML プロセッサから誤って属性値の終端と解釈されないよう、文字参照( &quot; または &apos; )を用いて入力するか、あるいは XML 属性が二重引用符で括られているのであれば式では一重引用符を用いるようにするか、その逆にする。 XPath expressions often occur in XML attributes. The grammar specified in this section applies to the attribute value after XML 1.0 normalization. So, for example, if the grammar uses the character <, this must not appear in the XML source as < but must be quoted according to XML 1.0 rules by, for example, entering it as &lt;. Within expressions, literal strings are delimited by single or double quotation marks, which are also used to delimit XML attributes. To avoid a quotation mark in an expression being interpreted by the XML processor as terminating the attribute value the quotation mark can be entered as a character reference (&quot; or &apos;). Alternatively, the expression can use single quotation marks if the XML attribute is delimited with double quotation marks or vice-versa.

式の中でもロケーションパスは重要な種類になる。 ロケーションパスは文脈ノードに相対的なノードの集合を選択する。 ロケーションパスの評価結果は、そのロケーションパスによって選択されたノードの集合になる。 ロケーションパスでは、式を入れ子にしてノードの集合を更にふるいにかけることも可能である。 ロケーションパスの生成規則は LocationPath である。 One important kind of expression is a location path. A location path selects a set of nodes relative to the context node. The result of evaluating an expression that is a location path is the node-set containing the nodes selected by the location path. Location paths can recursively contain expressions that are used to filter sets of nodes. A location path matches the production LocationPath.

以降に示す文法では、非終端の QNameNCName[XML Names] で定義され、 S[XML] で定義されるものとする。 この文法では [XML] と同じ EBNF 記法を用いる(文法記号の頭文字が常に大文字になる所だけが異なる)。 In the following grammar, the non-terminals QName and NCName are defined in [XML Names], and S is defined in [XML]. The grammar uses the same EBNF notation as [XML] (except that grammar symbols always have initial capital letters).

式の構文解析では、まず最初に解析対象の文字列がトークンに分割され、結果の一連のトークンが解析される。 トークンの間には空白を自由に挟める。 トークン化のプロセスについては [3.7 字句構造] で述べる。 Expressions are parsed by first dividing the character string to be parsed into tokens and then parsing the resulting sequence of tokens. Whitespace can be freely used between tokens. The tokenization process is described in [3.7 Lexical Structure].

加えて、簡便のためこの仕様では XML 1.0 と XML Names 1.0 を参照する。 しかしながら、実装は [XML][XML Names] の字句構造仕様、あるいは [XML 1.1][XML Names 1.1] の字句構造仕様のいずれのサポートを選択してもよい。 したがって、常に IRI を通した URI 参照もサポートしてもよい。 一部の場合では XML 1.0 と XML 1.1 の定義は完全に一致する。 In addition, XML 1.0 and XML Names 1.0 references are always used for convenience. However, an implementation may choose to support [XML] and [XML Names]., or [XML 1.1] and [XML Names 1.1] lexical specification. Thus, URI references are also always used though IRI may also be supported. In some cases, the XML 1.0 and XML 1.1 definitions may be exactly the same.

2 ロケーションパス

ロケーションパスは、 XPath 言語の中では最上位の文法上の構成要素ではないが( LocationPathExpr の特殊なケースになる)、最も重要なので最初に述べる。 Although location paths are not the most general grammatical construct in the language (a LocationPath is a special case of an Expr), they are the most important construct and will therefore be described first.

すべてのロケーションパスには、冗長だが確実な構文による表記がある。 より簡潔な表記による省略構文も数多く用意されている。 この節ではまず、非省略構文を用いたロケーションパスの意味内容について述べる。 しかる後、省略構文がどのように非省略構文に展開されるかについて述べる( [2.5 省略構文] 参照)。 Every location path can be expressed using a straightforward but rather verbose syntax. There are also a number of syntactic abbreviations that allow common cases to be expressed concisely. This section will explain the semantics of location paths using the unabbreviated syntax. The abbreviated syntax will then be explained by showing how it expands into the unabbreviated syntax (see [2.5 Abbreviated Syntax]).

非省略構文によるロケーションパスの例を以下に挙げる: Here are some examples of location paths using the unabbreviated syntax:

ロケーションパスには相対ロケーションパスと絶対ロケーションパスの2種類がある。 There are two kinds of location path: relative location paths and absolute location paths.

相対ロケーションパスは / で区切られた1つ以上のロケーションステップを順に並べたものから構成される。 各ステップは左から右に結合され、それぞれが文脈ノードに対して相対的なノードの集合を順次選択する。 各ステップの最初のシーケンスは、次のような方法で後続のステップと結合される。 各ステップの最初のシーケンスでは、文脈ノードに対して相対的なノードの集合を選択する。 その集合に属する各ノードは、後続のステップの文脈ノードに使用される。 後段のステップで特定されたノードの集合は1つに併合され、この併合されたノード集合が、ステップの結合により特定されるノード集合となる。 例えば child::div/child::para は文脈ノードの div 子要素の para 子要素を選択する。 言い換えれば div 要素を親に持つ para 孫要素を選択する。 A relative location path consists of a sequence of one or more location steps separated by /. The steps in a relative location path are composed together from left to right. Each step in turn selects a set of nodes relative to a context node. An initial sequence of steps is composed together with a following step as follows. The initial sequence of steps selects a set of nodes relative to a context node. Each node in that set is used as a context node for the following step. The sets of nodes identified by that step are unioned together. The set of nodes identified by the composition of the steps is this union. For example, child::div/child::para selects the para element children of the div element children of the context node, or, in other words, the para element grandchildren that have div parents.

絶対ロケーションパスは / とオプションで後続する相対ロケーションパスから構成される。 / 自体は文脈ノードを含んでいる文書のルートノードを選択する。 相対ロケーションパスを後続させた場合、そのロケーションパスは文脈ノードを含む文書のルートノードに対し相対的なノードの集合、すなわち、文脈ノードがルートノードだったとするときに相対ロケーションパスを単独で適用した結果選択されることになるノードの集合を選択する。 An absolute location path consists of / optionally followed by a relative location path. A / by itself selects the root node of the document containing the context node. If it is followed by a relative location path, then the location path selects the set of nodes that would be selected by the relative location path relative to the root node of the document containing the context node.

ロケーションパス
[1]LocationPath::=RelativeLocationPath
| AbsoluteLocationPath
[2]AbsoluteLocationPath::='/' RelativeLocationPath?
| AbbreviatedAbsoluteLocationPath
[3]RelativeLocationPath::=Step
| RelativeLocationPath '/' Step
| AbbreviatedRelativeLocationPath

2.1 ロケーションステップ

ロケーションステップは次の3つの部分からなる: A location step has three parts:

ロケーションステップの構文では、軸名とノードテストを二重コロンで区切り、角括弧で括られた式(述語)を0個以上後続させる。 例えば child::para[position()=1] では、 child が軸名, para がノードテスト, [position()=1] が述語になる。 The syntax for a location step is the axis name and node test separated by a double colon, followed by zero or more expressions each in square brackets. For example, in child::para[position()=1], child is the name of the axis, para is the node test and [position()=1] is a predicate.

ロケーションステップによるノード集合の選択においては、まず、軸とノードテストから初期ノード集合が生成され、その集合に対し述語により順次ふるいがかけられる。 The node-set selected by the location step is the node-set that results from generating an initial node-set from the axis and node-test, and then filtering that node-set by each of the predicates in turn.

この初期ノード集合は、文脈ノードとの間に軸で指定された関係を持ち、かつ、ノードテストで指定したノード型と 展開名 を持つノードからなる。 例えばロケーションステップ descendant::para は、文脈ノードの子孫の para 要素すべてを選択する。 この descendant は初期ノード集合に属する各ノードが文脈ノードの子孫でなければならないことを指定し, para は初期ノード集合に属する各ノードが para 要素でなければならないことを指定する。 どのような軸を利用できるのかについては [2.2 軸] にて述べる。 またノードテストについては [2.3 ノードテスト] にて述べる。 一部のノードテストは、軸により意味が変わり得る。 The initial node-set consists of the nodes having the relationship to the context node specified by the axis, and having the node type and expanded-name specified by the node test. For example, a location step descendant::para selects the para element descendants of the context node: descendant specifies that each node in the initial node-set must be a descendant of the context; para specifies that each node in the initial node-set must be an element named para. The available axes are described in [2.2 Axes]. The available node tests are described in [2.3 Node Tests]. The meaning of some node tests is dependent on the axis.

1つめの述語により、初期ノード集合はふるいにかけられ、新しいノード集合が生成される。 この新たなノード集合は更に2つめの述語でふるいにかけられ、以下同様に処理が続けられる。 このようにして最終的に残ったノード集合が、ロケーションステップにより選択されるノード集合になる。 各述語の式がどのように評価されるかは軸にも左右され、述語の意味内容は軸に関連して定義される。 [2.4 述語] 参照。 The initial node-set is filtered by the first predicate to generate a new node-set; this new node-set is then filtered using the second predicate, and so on. The final node-set is the node-set selected by the location step. The axis affects how the expression in each predicate is evaluated and so the semantics of a predicate is defined with respect to an axis. See [2.4 Predicates].

ロケーションステップ
[4]Step::=AxisSpecifier NodeTest Predicate*
| AbbreviatedStep
[5]AxisSpecifier::=AxisName '::'
| AbbreviatedAxisSpecifier

2.2 軸

次に挙げる軸が利用できる: The following axes are available:

注記: (属性ノードと名前空間ノードを無視するなら)一つの文書は軸 ancestor, descendant, following, preceding, self により分割される:これらの軸に互いに重複する部分はなく、文書内のすべてのノードはこれらの軸のいずれかに含まれる。 NOTE: The ancestor, descendant, following, preceding and self axes partition a document (ignoring attribute and namespace nodes): they do not overlap and together they contain all the nodes in the document.

[6]AxisName::='ancestor'
| 'ancestor-or-self'
| 'attribute'
| 'child'
| 'descendant'
| 'descendant-or-self'
| 'following'
| 'following-sibling'
| 'namespace'
| 'parent'
| 'preceding'
| 'preceding-sibling'
| 'self'

2.3 ノードテスト

どの軸にも 主ノード型 がある。 軸が要素を選択する場合、主ノード型は要素である。 それ以外は軸が選択するノードの型が主ノード型になる。 従って、 Every axis has a principal node type. If an axis can contain elements, then the principal node type is element; otherwise, it is the type of the nodes that the axis can contain. Thus,

QName によるノードテストでは、ノードの型( [5 データモデル] 参照)が主ノード型に一致し、かつ、ノードの 展開名QName が指定する 展開名 に一致するとき、そのときに限り、真と評価される。 例えば child::para は、文脈ノードの子の para 要素を選択するが、文脈ノードの子に para 要素が存在しない場合、選択されるノード集合は空になる。 attribute::href は文脈ノードの href 属性を選択するが、文脈ノードに href 属性が存在しない場合、選択されるノード集合は空になる。 A node test that is a QName is true if and only if the type of the node (see [5 Data Model]) is the principal node type and has an expanded-name equal to the expanded-name specified by the QName. For example, child::para selects the para element children of the context node; if the context node has no para children, it will select an empty set of nodes. attribute::href selects the href attribute of the context node; if the context node has no href attribute, it will select an empty set of nodes.

ノードテストにおける QName は、式の文脈に有効な名前空間宣言を用いて 展開名 に展開される。 これは開始タグや終了タグの要素型名(タグ名)の展開と同じ方法である。 ただし、 xmlns で宣言された既定の名前空間は利用されない。 従って、 QName に接頭辞が与えられていない場合、名前空間 URI は null になる(属性名の展開と同じ方法になる)。 QName に接頭辞が与えられていて、式の文脈においてその接頭辞の名前空間宣言が存在しない場合、エラーとする。 A QName in the node test is expanded into an expanded-name using the namespace declarations from the expression context. This is the same way expansion is done for element type names in start and end-tags except that the default namespace declared with xmlns is not used: if the QName does not have a prefix, then the namespace URI is null (this is the same way attribute names are expanded). It is an error if the QName has a prefix for which there is no namespace declaration in the expression context.

ノードテスト * は、主ノード型のノードであればどのノードでも真になる。 例えば child::* は文脈ノードのすべての子要素を選択し、 attribute::* は文脈ノードのすべての属性を選択する。 A node test * is true for any node of the principal node type. For example, child::* will select all element children of the context node, and attribute::* will select all attributes of the context node.

ノードテストは NCName:* の形式もとれる。 この場合、接頭辞( NCName の部分)が、文脈に有効な名前空間宣言を用いて QName と同じように展開される。 式の文脈に有効な名前空間宣言にこの接頭辞に対応するものが存在しない場合、エラーとする。 このノードテストでは、主ノード型の任意のノードに対し、その 展開名 の名前空間 URI がこの接頭辞を展開した名前空間 URI に一致するとき(局所部が何であれ)真になる。 【 * はすべての局所部に一致するワイルドカードと見なせる】 A node test can have the form NCName:*. In this case, the prefix is expanded in the same way as with a QName, using the context namespace declarations. It is an error if there is no namespace declaration for the prefix in the expression context. The node test will be true for any node of the principal type whose expanded-name has the namespace URI to which the prefix expands, regardless of the local part of the name.

ノードテスト text() は、どのテキストノードに対しても真になる。 例えば child::text() は文脈ノードの子テキストノードを選択する。 同様に、ノードテスト comment() もすべてのコメントノードに対し真になり, ノードテスト processing-instruction() もすべての処理命令に対し真になる。 ノードテスト processing-instruction()Literal 引数もとり得る。 この場合、 Literal の値と同じ名前を持つ処理命令すべてに対し真になる。 The node test text() is true for any text node. For example, child::text() will select the text node children of the context node. Similarly, the node test comment() is true for any comment node, and the node test processing-instruction() is true for any processing instruction. The processing-instruction() test may have an argument that is Literal; in this case, it is true for any processing instruction that has a name equal to the value of the Literal.

ノードテスト node() は、どのような型のノードでも真になる。 A node test node() is true for any node of any type whatsoever.

[7]NodeTest::=NameTest
| NodeType '(' ')'
| 'processing-instruction' '(' Literal ')'

2.4 述語

軸は正順軸または逆順軸のいずれかである。 正順軸は文脈ノード自身か 文書順 で文脈ノードより後にあるノードのみを選択の対象にする。 逆順軸は文脈ノード自身か 文書順 で文脈ノードより前にあるノードだけを選択の対象にする。 すなわち、 ancestor, ancestor-or-self, preceding, preceding-sibling は逆順軸であり、それ以外はすべて正順軸になる。 self 軸は常に高々1個のノードしか含まれないため、正順軸と逆順軸のどちらに解釈しても同じになる。 軸に関するノード集合に属するノードの 近さ ( proximity position )は、正順軸の場合は文書順のまま、逆順軸の場合は文書順と逆順によるノード集合内でのノードの位置から定まるものとする。 最初の位置は 1 である。 An axis is either a forward axis or a reverse axis. An axis that only ever contains the context node or nodes that are after the context node in document order is a forward axis. An axis that only ever contains the context node or nodes that are before the context node in document order is a reverse axis. Thus, the ancestor, ancestor-or-self, preceding, and preceding-sibling axes are reverse axes; all other axes are forward axes. Since the self axis always contains at most one node, it makes no difference whether it is a forward or reverse axis. The proximity position of a member of a node-set with respect to an axis is defined to be the position of the node in the node-set ordered in document order if the axis is a forward axis and ordered in reverse document order if the axis is a reverse axis. The first position is 1.

述語は軸を基にしてノード集合をふるいにかけ、新しいノード集合を生成する。 ふるいの対象のノード集合に属する各ノードに対し、そのノードを文脈ノードとして PredicateExpr を評価する。 このとき、ノード集合内のノード数を文脈サイズに用い、軸におけるノード集合内のノードの 近さ を文脈位置に用いる。 ノードに対する PredicateExpr の評価結果が真になれば、そのノードは新しいノード集合に入り、偽の場合は入らない。 A predicate filters a node-set with respect to an axis to produce a new node-set. For each node in the node-set to be filtered, the PredicateExpr is evaluated with that node as the context node, with the number of nodes in the node-set as the context size, and with the proximity position of the node in the node-set with respect to the axis as the context position; if PredicateExpr evaluates to true for that node, the node is included in the new node-set; otherwise, it is not included.

PredicateExpr の評価においては Expr の評価結果がブール値に変換される。 結果が数値の場合、それが文脈位置と同じなら真、そうでないなら偽に変換される。 結果が数値以外の場合、 boolean 関数を呼び出したかのように変換される。 従って、ロケーションパス para[3]para[position()=3] と等価になる。 A PredicateExpr is evaluated by evaluating the Expr and converting the result to a boolean. If the result is a number, the result will be converted to true if the number is equal to the context position and will be converted to false otherwise; if the result is not a number, then the result will be converted as if by a call to the boolean function. Thus a location path para[3] is equivalent to para[position()=3].

述語
[8]Predicate::='[' PredicateExpr ']'
[9]PredicateExpr::=Expr

2.5 省略構文

省略構文を用いたロケーションパスの例を以下に挙げる: Here are some examples of location paths using abbreviated syntax:

省略構文で最も重要なのは、ロケーションステップから child:: を省略できることである。 事実上、 child が既定の軸になる。 例えばロケーションパス div/parachild::div/child::para の省略形になる。 The most important abbreviation is that child:: can be omitted from a location step. In effect, child is the default axis. For example, a location path div/para is short for child::div/child::para.

また、 attribute 軸にも省略形がある。 attribute::@ に省略できる。 例えばロケーションパス para[@type="warning"]child::para[attribute::type="warning"] の省略形であり、 type 属性の値が warningpara 子要素を選択する。 There is also an abbreviation for attributes: attribute:: can be abbreviated to @. For example, a location path para[@type="warning"] is short for child::para[attribute::type="warning"] and so selects para children with a type attribute with value equal to warning.

///descendant-or-self::node()/ の省略形である。 例えば //para/descendant-or-self::node()/child::para の省略形であり、文書内のあらゆる para 要素を選択する( para が文書要素であっても、文書要素ノードはルートノードの子なので選択されることになる)。 div//parachild::div/descendant-or-self::node()/child::para の省略形であり、 div 子要素(すべて)の para 子孫要素すべてを選択する。 // is short for /descendant-or-self::node()/. For example, //para is short for /descendant-or-self::node()/child::para and so will select any para element in the document (even a para element that is a document element will be selected by //para since the document element node is a child of the root node); div//para is short for child::div/descendant-or-self::node()/child::para and so will select all para descendants of div children.

注記: ロケーションパス //para[1] はロケーションパス /descendant::para[1]同じではない。 後者は、最初の para 子孫要素を選択する一方、前者は、その要素の親にとって最初の para 子要素になるような para 子孫要素すべてを選択する。 NOTE: The location path //para[1] does not mean the same as the location path /descendant::para[1]. The latter selects the first descendant para element; the former selects all descendant para elements that are the first para children of their parents.

ロケーションステップ .self::node() の省略形である。 この省略形は特に // と併用すると有用になる。 例えばロケーションパス .//para は、 A location step of . is short for self::node(). This is particularly useful in conjunction with //. For example, the location path .//para is short for

self::node()/descendant-or-self::node()/child::para

の省略形であり、文脈ノードの para 子孫要素すべてを選択する。 and so will select all para descendant elements of the context node.

同様に、ロケーションステップ ..parent::node() の省略形である。 例えば ../titleparent::node()/child::title の省略形であり、文脈ノードの親ノードの title 子要素すべてを選択する。 Similarly, a location step of .. is short for parent::node(). For example, ../title is short for parent::node()/child::title and so will select the title children of the parent of the context node.

省略構文
[10]AbbreviatedAbsoluteLocationPath::='//' RelativeLocationPath
[11]AbbreviatedRelativeLocationPath::=RelativeLocationPath '//' Step
[12]AbbreviatedStep::='.'
| '..'
[13]AbbreviatedAxisSpecifier::='@'?

3 式

3.1 基本

VariableReference (「変数参照」)は、文脈における変数束縛の集合の中で、その変数名に結びつけられている値に評価される。 式の文脈における変数束縛の集合で、その変数名がどの値にも結びつけられていない場合、エラーとする。 A VariableReference evaluates to the value to which the variable name is bound in the set of variable bindings in the context. It is an error if the variable name is not bound to any value in the set of variable bindings in the expression context.

グループ化には括弧が用いられる。 Parentheses may be used for grouping.

[14]Expr::=OrExpr
[15]PrimaryExpr::=VariableReference
| '(' Expr ')'
| Literal
| Number
| FunctionCall

3.2 関数呼び出し

FunctionCall 式の評価においては、まず FunctionName を用いてその式が評価される文脈の関数ライブラリの関数が特定され、各 引数 は評価されてから関数が必要とする型に変換され、最終的にそれらを引数に関数が呼び出される。 引数の個数が誤っていたり、引数を必要な型に変換できない場合、エラーとする。 関数の返り値が FunctionCall 式の結果になる。 A FunctionCall expression is evaluated by using the FunctionName to identify a function in the expression evaluation context function library, evaluating each of the Arguments, converting each argument to the type required by the function, and finally calling the function, passing it the converted arguments. It is an error if the number of arguments is wrong or if an argument cannot be converted to the required type. The result of the FunctionCall expression is the result returned by the function.

引数は string 関数を呼び出したかのように文字列型に変換されたり、 number 関数を呼び出したかのように数値型に変換されたり、 boolean 関数を呼び出したかのようにブール型に変換される。 ノード集合型でない引数がノード集合に変換されることはない。 An argument is converted to type string as if by calling the string function. An argument is converted to type number as if by calling the number function. An argument is converted to type boolean as if by calling the boolean function. An argument that is not of type node-set cannot be converted to a node-set.

[16]FunctionCall::=FunctionName '(' ( Argument ( ',' Argument )* )? ')'
[17]Argument::=Expr

3.3 ノード集合

ロケーションパスを式として用いることもできる。 この式は、パスが選択するノードの集合を返す。 A location path can be used as an expression. The expression returns the set of nodes selected by the path.

演算子 | はノード集合の和に用いられる。 オペランドはノード集合でなければならない。 The | operator computes the union of its operands, which must be node-sets.

述語 を用いてロケーションパスと同じ方法で式にふるいをかけられる。 ふるいをかけられた式の評価結果がノード集合にならない場合、エラーとする。 述語 は、child 軸を基にノード集合をふるいにかける。 Predicates are used to filter expressions in the same way that they are used in location paths. It is an error if the expression to be filtered does not evaluate to a node-set. The Predicate filters the node-set with respect to the child axis.

注記: 述語 の意味は、適用する軸に大きく依存する。 例えば preceding::foo[1] は、述語 [1] を適用する軸が preceding 軸になるので、逆文書順で最初の foo 要素を返す。 一方、 (preceding::foo)[1] では、述語 [1] を適用する軸が child 軸になるので、文書順で最初の foo 要素を返す。 NOTE: The meaning of a Predicate depends crucially on which axis applies. For example, preceding::foo[1] returns the first foo element in reverse document order, because the axis that applies to the [1] predicate is the preceding axis; by contrast, (preceding::foo)[1] returns the first foo element in document order, because the axis that applies to the [1] predicate is the child axis.

演算子 / と演算子 // は、式と相対ロケーションパスを組み合わせる。 式の評価がノード集合にならない場合、エラーとする。 演算子 // をロケーションパスで用いるときと同じように合成を行う。 ロケーションパスの場合と同様、 ///descendant-or-self::node()/ の省略形である。 The / and // operators compose an expression and a relative location path. It is an error if the expression does not evaluate to a node-set. The / operator does composition in the same way as when / is used in a location path. As in location paths, // is short for /descendant-or-self::node()/.

ノード集合に変換できる型のオブジェクトはない。 There are no types of objects that can be converted to node-sets.

[18]UnionExpr::=PathExpr
| UnionExpr '|' PathExpr
[19]PathExpr::=LocationPath
| FilterExpr
| FilterExpr '/' RelativeLocationPath
| FilterExpr '//' RelativeLocationPath
[20]FilterExpr::=PrimaryExpr
| FilterExpr Predicate

3.4 ブール

ブール型のオブジェクトは、真と偽の2つの値いずれかをとる。 An object of type boolean can have one of two values, true and false.

or 式の評価においては、まず各オペランドが評価され、その値が boolean 関数を呼び出したかのようにブール型に変換される。 評価結果はどちらかの値が真ならば真、それ以外は偽になる。 左側のオペランドが真と評価された場合、右側のオペランドは評価されない。 An or expression is evaluated by evaluating each operand and converting its value to a boolean as if by a call to the boolean function. The result is true if either value is true and false otherwise. The right operand is not evaluated if the left operand evaluates to true.

and 式の評価においても、まず各オペランドが評価され、その値が boolean 関数を呼び出したかのようにブール型に変換されたる。 評価結果は両方の値が真ならば真、それ以外は偽になる。 左側のオペランドが偽と評価された場合は、右側のオペランドは評価されない。 An and expression is evaluated by evaluating each operand and converting its value to a boolean as if by a call to the boolean function. The result is true if both values are true and false otherwise. The right operand is not evaluated if the left operand evaluates to false.

RelationalExpr より広い) EqualityExpr と( AdditiveExpr より広い) RelationalExpr は、2つのオペランドを評価した結果のオブジェクトの比較により評価される。 ここではこの比較を、下の3段落に分けて定義する: まず、ノード集合を含む比較は、ノード集合を含まない比較を用いて定義する。 これは =, !=, <=, <, >=, > に対し、統一的に定義される。 次に、ノード集合を含まない比較を = と != に対し定義する。 最後に、ノード集合を含まない比較を <=, <, >=, > に対し定義する。 An EqualityExpr (that is not just a RelationalExpr) or a RelationalExpr (that is not just an AdditiveExpr) is evaluated by comparing the objects that result from evaluating the two operands. Comparison of the resulting objects is defined in the following three paragraphs. First, comparisons that involve node-sets are defined in terms of comparisons that do not involve node-sets; this is defined uniformly for =, !=, <=, <, >= and >. Second, comparisons that do not involve node-sets are defined for = and !=. Third, comparisons that do not involve node-sets are defined for <=, <, >= and >.

ノード集合を含む比較は次のようにして定義される:オペランドが (1) 両方ともノード集合の場合、一方のノード集合に属するノードと、もう一方のノード集合に属するノードの中で 文字列値 の比較結果が真になるような2つのノードが存在するとき、そのときに限り、比較結果を真とする。 (2) 一方がノード集合でもう一方が数値の場合、ノード集合に属するノードの中で、そのノードの 文字列値number 関数で数値に変換してから2つの数値を比較した結果が真になるようなノードが存在するとき、そのときに限り、比較結果を真とする。 (3) 一方がノード集合でもう一方が文字列の場合、ノード集合に属するノードの中で、その 文字列値 ともう一方の文字列との比較結果が真になるようなノードが存在するとき、そのときに限り、比較結果を真とする。 (4) 一方がノード集合でもう一方がブール値の場合、ノード集合を boolean 関数を用いてブール値に変換した後2つのブール値を比較した結果が真になるとき、そのときに限り、比較結果を真とする。 If both objects to be compared are node-sets, then the comparison will be true if and only if there is a node in the first node-set and a node in the second node-set such that the result of performing the comparison on the string-values of the two nodes is true. If one object to be compared is a node-set and the other is a number, then the comparison will be true if and only if there is a node in the node-set such that the result of performing the comparison on the number to be compared and on the result of converting the string-value of that node to a number using the number function is true. If one object to be compared is a node-set and the other is a string, then the comparison will be true if and only if there is a node in the node-set such that the result of performing the comparison on the string-value of the node and the other string is true. If one object to be compared is a node-set and the other is a boolean, then the comparison will be true if and only if the result of performing the comparison on the boolean and on the result of converting the node-set to a boolean using the boolean function is true.

演算子 =, != における、ノード集合を含まない比較は次のようにして定義される: まず比較対象のオブジェクトを共通の型に変換する: (1) オペランドの少なくともいずれか一方がブール値の場合、それぞれを boolean 関数でブール値に変換する。 (2) (1) でなく、かつ、オペランドの少なくともいずれか一方が数値の場合、それぞれを number 関数で数値に変換する。 (3) (1) (2) 以外の場合は、オペランドを string 関数で文字列に変換する。 = による比較は、オブジェクトが等しいときに限り、真とする。 != による比較は、オブジェクトが等しくないときに限り、真とする。 数値は、 IEEE 754 [IEEE 754] に従って等しいかどうかを比較する。 2つのブール値は、共に真または共に偽のとき、等しいものとする。 2つの文字列は、それらが同じ並びの UCS 文字列になるとき、等しいものとする。 When neither object to be compared is a node-set and the operator is = or !=, then the objects are compared by converting them to a common type as follows and then comparing them. If at least one object to be compared is a boolean, then each object to be compared is converted to a boolean as if by applying the boolean function. Otherwise, if at least one object to be compared is a number, then each object to be compared is converted to a number as if by applying the number function. Otherwise, both objects to be compared are converted to strings as if by applying the string function. The = comparison will be true if and only if the objects are equal; the != comparison will be true if and only if the objects are not equal. Numbers are compared for equality according to IEEE 754 [IEEE 754]. Two booleans are equal if either both are true or both are false. Two strings are equal if and only if they consist of the same sequence of UCS characters.

注記: $x がノード集合に結びつけられている場合、 $x="foo"not($x!="foo") は同じにならない。 前者は $x 内のいずれかのノードの文字列値が foo になるときに限り真になる一方、後者は $x 内のすべてのノードの文字列値が foo になるときに限り真になる。 NOTE: If $x is bound to a node-set, then $x="foo" does not mean the same as not($x!="foo"): the former is true if and only if some node in $x has the string-value foo; the latter is true if and only if all nodes in $x have the string-value foo.

演算子 <=, <, >=, > における、ノード集合を含まない比較では、まず両方のオブジェクトが数値に変換され、それらの数値が IEEE 754 に従って比較される。 < による比較は、左辺値が右辺値より小さいときに限り真になる。 <= による比較は、左辺値が右辺値以下のときに限り真になる。 > による比較は、左辺値が右辺値より大きいときに限り真になる。 >= による比較は、左辺値が右辺値以上のときに限り真になる。 When neither object to be compared is a node-set and the operator is <=, <, >= or >, then the objects are compared by converting both objects to numbers and comparing the numbers according to IEEE 754. The < comparison will be true if and only if the first number is less than the second number. The <= comparison will be true if and only if the first number is less than or equal to the second number. The > comparison will be true if and only if the first number is greater than the second number. The >= comparison will be true if and only if the first number is greater than or equal to the second number.

注記: XPath 式を XML 文書内で用いる際は、演算子の <, <= などはすべて XML 1.0 に従い、例えば &lt;&lt;= のようにクオートしなければならない。 次の例は、 test 属性の値が XPath 式になっている: When an XPath expression occurs in an XML document, any < and <= operators must be quoted according to XML 1.0 rules by using, for example, &lt; and &lt;=. In the following example the value of the test attribute is an XPath expression:

<xsl:if test="@value &lt; 10">...</xsl:if>
[21]OrExpr::=AndExpr
| OrExpr 'or' AndExpr
[22]AndExpr::=EqualityExpr
| AndExpr 'and' EqualityExpr
[23]EqualityExpr::=RelationalExpr
| EqualityExpr '=' RelationalExpr
| EqualityExpr '!=' RelationalExpr
[24]RelationalExpr::=AdditiveExpr
| RelationalExpr '<' AdditiveExpr
| RelationalExpr '>' AdditiveExpr
| RelationalExpr '<=' AdditiveExpr
| RelationalExpr '>=' AdditiveExpr

注記: 上の構文において演算子の優先順位は低い方から次のようになる: NOTE: The effect of the above grammar is that the order of precedence is (lowest precedence first):

  • or
  • and
  • =, !=
  • <=, <, >=, >

また、演算子はすべて左から結合される。 例えば 3 > 2 > 1(3 > 2) > 1 と等価であり、偽になる。 and the operators are all left associative. For example, 3 > 2 > 1 is equivalent to (3 > 2) > 1, which evaluates to false.

3.5 数

数は浮動小数点数を表す。 数は、倍精度 64 ビット形式の IEEE 754 の値 [IEEE 754] を取ることができる。 これには、特別な値 "Not-a-Number" (NaN) , 正の無限大と負の無限大, 正のゼロ, 負のゼロも含まれる。 IEEE 754 標準における主な規則の概要については [JLS]4.2.3 節 を参照。 A number represents a floating-point number. A number can have any double-precision 64-bit format IEEE 754 value [IEEE 754]. These include a special "Not-a-Number" (NaN) value, positive and negative infinity, and positive and negative zero. See Section 4.2.3 of [JLS] for a summary of the key rules of the IEEE 754 standard.

数値演算子は number 関数を呼び出したかのように、オペランドを数に変換する。 The numeric operators convert their operands to numbers as if by calling the number function.

+ 演算子は加算を実行する。 The + operator performs addition.

二項 - 演算子は減算を実行する。 単項 - 演算子は符号反転を実行する。 -0 は負のゼロに評価されることに注意。 The binary - operator performs subtraction. The unary - operator performs negation. Note that -0 evaluates to negative zero.

注記: XML では名前に - を使えるため、通常、 - 演算子の前に空白を入れる必要がある。 例えば foo-barfoo-bar 子要素を含むノード集合になる。 foo - bar は、最初の foo 子要素の 文字列値 を数値に変換した結果と、最初の bar 子要素の 文字列値 を数値に変換した結果との差になる。 NOTE: Since XML allows - in names, the - operator typically needs to be preceded by whitespace. For example, foo-bar evaluates to a node-set containing the child elements named foo-bar; foo - bar evaluates to the difference of the result of converting the string-value of the first foo child element to a number and the result of converting the string-value of the first bar child to a number.

* 演算子は IEEE 754 に基づいた浮動小数点の掛け算を実行する。 結果は NaN でないならば、2つのオペランドの符号が等しいときに限り、正になる。 The * operator performs floating-point multiplication according to IEEE 754. Note that, if the result is not NaN, the result is positive if and only if both operands have the same sign.

div 演算子は IEEE 754 に基づいた浮動小数点の割り算を実行する。 結果は NaN でないならば、2つのオペランドの符号が等しいときに限り、正になる。 The div operator performs floating-point division according to IEEE 754. Note that, if the result is not NaN, the result is positive if and only if both operands have the same sign.

mod 演算子は、切り捨て除算による余りを返す。例えば、 The mod operator returns the remainder from a truncating division. For example,

注記: これは Java や ECMAScript の % 演算子と同じである。 NOTE: This is the same as the % operator in Java and ECMAScript.

注記: 丸め除算による余りを返す IEEE 754 の仕様とは異なる。 【参考: java.lang.Math の IEEEremainder 】 NOTE: This is not the same as the IEEE 754 remainder operation, which returns the remainder from a rounding division.

算術式
[25]AdditiveExpr::=MultiplicativeExpr
| AdditiveExpr '+' MultiplicativeExpr
| AdditiveExpr '-' MultiplicativeExpr
[26]MultiplicativeExpr::=UnaryExpr
| MultiplicativeExpr MultiplyOperator UnaryExpr
| MultiplicativeExpr 'div' UnaryExpr
| MultiplicativeExpr 'mod' UnaryExpr
[27]UnaryExpr::=UnionExpr
| '-' UnaryExpr

3.6 文字列

文字列は0個以上の文字の並びである。 文字の定義は XML 勧告 [XML] と同じである。 従って XPath 内の文字1個は Unicode スカラ値1個を伴う1個の Unicode 抽象文字に対応する( [Unicode] 参照)。 これは 16 ビット Unicode 符号値と同じではない: U+FFFF より大きい Unicode スカラ値を伴う抽象文字の Unicode 符号による文字表現は 16 ビット Unicode 符号値のペアになる(サロゲートペア)。 多くのプログラミング言語では文字列を 16 ビット Unicode 符号値の並びで表現する。 そのような言語で XPath を実装する際は、このサロゲートペアが XPath 文字の1文字として正しく扱われるように注意しなければならない。 Strings consist of a sequence of zero or more characters, where a character is defined as in the XML Recommendation [XML]. A single character in XPath thus corresponds to a single Unicode abstract character with a single corresponding Unicode scalar value (see [Unicode]); this is not the same thing as a 16-bit Unicode code value: the Unicode coded character representation for an abstract character with Unicode scalar value greater that U+FFFF is a pair of 16-bit Unicode code values (a surrogate pair). In many programming languages, a string is represented by a sequence of 16-bit Unicode code values; implementations of XPath in such languages must take care to ensure that a surrogate pair is correctly treated as a single XPath character.

注記: Unicode においては、 Unicode 抽象文字の並びとしては異なるにも関わらず、同一のものとして扱われるべき文字列が存在する。 例えば一部のアクセント付き文字は合成済形と分解形のいずれの形式でも表現し得る。 従って XPath 式内の文字と XML 文書内の文字のいずれかが正準形に正規化されていない場合、 XPath 式は予期しない結果を返し得る。 [Character Model] 参照。 NOTE: It is possible in Unicode for there to be two strings that should be treated as identical even though they consist of the distinct sequences of Unicode abstract characters. For example, some accented characters may be represented in either a precomposed or decomposed form. Therefore, XPath expressions may return unexpected results unless both the characters in the XPath expression and in the XML document have been normalized into a canonical form. See [Character Model].

3.7 字句構造

トークン化においては、常に可能な限り長いトークンが返される。 When tokenizing, the longest possible token is always returned.

可読性のため、文法で明示的に許されていない所でも、式の中の ExprToken の前後には空白 ExprWhitespace を自由に追加できる。 For readability, whitespace may be used in expressions even though not explicitly allowed by the grammar: ExprWhitespace may be freely added within patterns expressions before or after any ExprToken. , but not in the middle of an ExprToken

ExprToken の文法的多義性を回避するため、次に挙げる特別なトークン化規則が順に適用されなければならない: The following special tokenization rules must be applied in the order specified to disambiguate the ExprToken grammar:

式の字句構造
[28]ExprToken::='(' | ')' | '[' | ']' | '.' | '..' | '@' | ',' | '::'
| NameTest
| NodeType
| Operator
| FunctionName
| AxisName
| Literal
| Number
| VariableReference
[29]Literal::='"' [^"]* '"'
| "'" [^']* "'"
[30]Number::=Digits ('.' Digits?)?
| '.' Digits
[31]Digits::=[0-9]+
[32]Operator::=OperatorName
| MultiplyOperator
| '/' | '//' | '|' | '+' | '-' | '=' | '!=' | '<' | '<=' | '>' | '>='
[33]OperatorName::='and' | 'or' | 'mod' | 'div'
[34]MultiplyOperator::='*'
[35]FunctionName::= QName - NodeType
[36]VariableReference::='$' QName
[37]NameTest::='*'
| NCName ':' '*'
| QName
[38]NodeType::='comment'
| 'text'
| 'processing-instruction'
| 'node'
[39]ExprWhitespace::=S

ホスト言語は [XML][XML Names] の字句規則に従うか、 [XML 1.1][XML Names 1.1] の字句規則に従うかいずれを選択してもよい。 A host language may choose whether the lexical rules of [XML] and [XML Names] are followed, or alternatively, the lexical rules of [XML 1.1] and [XML Names 1.1] are followed.

4 コア関数ライブラリ

この節では、XPath を実装する際に、式の評価に利用する関数ライブラリに必ず含めなければならない関数について述べる。 This section describes functions that XPath implementations must always include in the function library that is used to evaluate expressions.

関数ライブラリの各関数は、関数の返り値の型, 関数名, 引数の型を与える関数プロトタイプで指定される。 型に疑問符が付いている引数はオプションである。 疑問符が付いていない引数は必須である。 Each function in the function library is specified using a function prototype, which gives the return type, the name of the function, and the type of the arguments. If an argument type is followed by a question mark, then the argument is optional; otherwise, the argument is required.

4.1 ノード集合関数

関数: number last()

last 関数は、式の評価文脈における 文脈サイズ に等しい数を返す。 The last function returns a number equal to the context size from the expression evaluation context.

関数: number position()

position 関数は、式の評価文脈における 文脈位置 に等しい数を返す。 The position function returns a number equal to the context position from the expression evaluation context.

関数: number count ( node-set )

count 関数は、引数に指定されたノード集合に含まれるノードの個数を返す。 The count function returns the number of nodes in the argument node-set.

関数: node-set id ( object )

id 関数は、一意 ID により要素を選択する( [5.2.1 一意 ID] 参照)。 引数の型がノード集合の場合、引数に指定されたノード集合内の各ノードの 文字列値id 関数を適用した結果の集合が結果になる。 引数が他の型の場合、 string 関数を呼び出したかのように引数を文字列に変換し、この文字列を空白区切りのトークンのリストに分解する(空白とは、 XML の生成規則 S に一致する任意の文字列を指す)。 結果は、文脈ノードと同じ文書内で、一意 ID がこのリストに含まれるトークンのいずれかに等しくなる要素の集合になる。 The id function selects elements by their unique ID (see [5.2.1 Unique IDs]). When the argument to id is of type node-set, then the result is the union of the result of applying id to the string-value of each of the nodes in the argument node-set. When the argument to id is of any other type, the argument is converted to a string as if by a call to the string function; the string is split into a whitespace-separated list of tokens (whitespace is any sequence of characters matching the production S); the result is a node-set containing the elements in the same document as the context node that have a unique ID equal to any of the tokens in the list.

  • id("foo") は一意 ID foo を持つ要素を選択する。 id("foo") selects the element with unique ID foo

  • id("foo")/child::para[position()=5] は一意 ID foo を持つ要素の 5 番目の para 子要素を選択する。 id("foo")/child::para[position()=5] selects the fifth para child of the element with unique ID foo

関数: string local-name ( node-set ? )

local-name 関数は、引数に渡されたノード集合の中で 文書順 で最初になるノードの 展開名 の局所部を返す。 引数のノード集合が空であったり, 最初のノードが 展開名 を持たない場合、空文字列を返す。 引数が省略された場合、文脈ノード1個からなるノード集合が既定の引数として用いられる。 The local-name function returns the local part of the expanded-name of the node in the argument node-set that is first in document order. If the argument node-set is empty or the first node has no expanded-name, an empty string is returned. If the argument is omitted, it defaults to a node-set with the context node as its only member.

関数: string namespace-uri ( node-set ? )

namespace-uri 関数は、引数に渡されたノード集合の中で 文書順 で最初になるノードの 展開名 の名前空間 URI を返す。 引数のノード集合が空であったり, 最初のノードが 展開名 を持っていなかったり, 展開名 の名前空間 URI が null だった場合、空文字列を返す。 引数が省略された場合、文脈ノード1個からなるノード集合が既定の引数として用いられる。 The namespace-uri function returns the namespace URI of the expanded-name of the node in the argument node-set that is first in document order. If the argument node-set is empty, the first node has no expanded-name, or the namespace URI of the expanded-name is null, an empty string is returned. If the argument is omitted, it defaults to a node-set with the context node as its only member.

注記: namespace-uri 関数が返す文字列は、要素ノードと属性ノード以外は空になる。 NOTE: The string returned by the namespace-uri function will be empty except for element nodes and attribute nodes.

関数: string name ( node-set ? )

name 関数は、引数に渡されたノード集合の中で 文書順 で最初のノードの 展開名 を表現する QName を返す。 この QName はノードにおいて有効な名前空間宣言を利用する展開による 展開名 を表現しなければならない。 これは通常、XML ソースの中の QName になるが、複数の接頭辞がノードにおいて有効な名前空間宣言により同じ名前空間に結びつけられている場合、そうなる必要はない。 しかしながら、実装においては、ノードの表現に元の接頭辞の情報も含ませることにより、 name 関数が常に XML ソースで用いられている QName と同じ文字列を返すようにもできる。 引数のノード集合が空であったり, 最初のノードが 展開名 を持たない場合、空文字列を返す。 引数が省略された場合、文脈ノード1個からなるノード集合が既定の引数として用いられる。 The name function returns a string containing a QName representing the expanded-name of the node in the argument node-set that is first in document order. The QName must represent the expanded-name with respect to the namespace declarations in effect on the node whose expanded-name is being represented. Typically, this will be the QName that occurred in the XML source. This need not be the case if there are namespace declarations in effect on the node that associate multiple prefixes with the same namespace. However, an implementation may include information about the original prefix in its representation of nodes; in this case, an implementation can ensure that the returned string is always the same as the QName used in the XML source. If the argument node-set is empty or the first node has no expanded-name, an empty string is returned. If the argument it omitted, it defaults to a node-set with the context node as its only member.

注記: 要素ノードと属性ノードを除き、name 関数が返す文字列は local-name 関数が返す文字列と同じである。 NOTE: The string returned by the name function will be the same as the string returned by the local-name function except for element nodes and attribute nodes.

4.2 文字列関数

関数: string string ( object ? )

string 関数は、次のようにオブジェクトを文字列に変換する: The string function converts an object to a string as follows:

  • ノード集合は、その中の 文書順 で最初のノードの 文字列値 に変換される。 ノード集合が空だった場合、空文字列が返される。 A node-set is converted to a string by returning the string-value of the node in the node-set that is first in document order. If the node-set is empty, an empty string is returned.

  • 数値は以下のように文字列に変換される: A number is converted to a string as follows

    • NaN は文字列 NaN に変換される。 NaN is converted to the string NaN

    • 正のゼロは文字列 0 に変換される。 positive zero is converted to the string 0

    • 負のゼロは文字列 0 に変換される。 negative zero is converted to the string 0

    • 正の無限大は文字列 Infinity に変換される。 positive infinity is converted to the string Infinity

    • 負の無限大は文字列 -Infinity に変換される。 negative infinity is converted to the string -Infinity

    • 数値が整数の場合、小数点もゼロも前置されない Number として十進形式で表現される。 負数にはマイナス符号( - )が前置される。 if the number is an integer, the number is represented in decimal form as a Number with no decimal point and no leading zeros, preceded by a minus sign (-) if the number is negative

    • 数値が整数でない場合、 Number として、小数点とその前後に少なくとも1桁以上の数字が含まれる十進形式で表現される。 負数にはマイナス符号( - )が前置される。 整数部の桁は、小数点の直前に必要なる1桁を除き、ゼロから開始されてはならない。 小数部の桁は、小数点の直後に必要な1桁を除き、他のすべての IEEE 754 数値と一意的に区別するために必要かつ十分な桁数にしなければならない。 otherwise, the number is represented in decimal form as a Number including a decimal point with at least one digit before the decimal point and at least one digit after the decimal point, preceded by a minus sign (-) if the number is negative; there must be no leading zeros before the decimal point apart possibly from the one required digit immediately before the decimal point; beyond the one required digit after the decimal point there must be as many, but only as many, more digits as are needed to uniquely distinguish the number from all other IEEE 754 numeric values.

  • ブール値の偽は文字列 false に変換される。 ブール値の真は、文字列 true に変換される。 The boolean false value is converted to the string false. The boolean true value is converted to the string true.

  • 4つの基本型以外の型のオブジェクトは、その型に応じた方法で文字列に変換される。 An object of a type other than the four basic types is converted to a string in a way that is dependent on that type.

引数が省略された場合、文脈ノード1個からなるノード集合が既定の引数として用いられる。 If the argument is omitted, it defaults to a node-set with the context node as its only member.

注記: string 関数による数値の文字列への変換には、利用者に対する表示目的は意図されていない。 この目的には [XSLT]format-number 関数と xsl:number 要素が提供されている。 NOTE: The string function is not intended for converting numbers into strings for presentation to users. The format-number function and xsl:number element in [XSLT] provide this functionality.

関数: string concat ( string, string, string * )

concat 関数は引数を連結して返す。 The concat function returns the concatenation of its arguments.

関数: boolean starts-with ( string, string )

starts-with 関数は、第1引数の文字列が第2引数の文字列で開始されていれば真を返し、そうでなければ偽を返す。 第2引数が空文字列だった場合、真を返す。 The starts-with function returns true if the first argument string starts with the second argument string, and otherwise returns false. If the second argument string is the empty string, then true is returned.

関数: boolean contains ( string, string )

contains 関数は、第1引数の文字列に第2引数の文字列が含まれていれば真を返し、そうでなければ偽を返す。 第2引数が空文字列だった場合、真を返す。 The contains function returns true if the first argument string contains the second argument string, and otherwise returns false. If the second argument string is the empty string, then true is returned.

関数: string substring-before ( string, string )

substring-before 関数は、第2引数の文字列が第1引数の文字列の中に現れるならば、最初に現れる所より前の部分の第1引数の部分文字列を返す。 第2引数の文字列が第1引数の文字列の中に現れない場合、空文字列を返す。 例えば substring-before("1999/04/01","/")1999 を返す。 第2引数の文字列が空文字列だった場合、空文字列を返す。 The substring-before function returns the substring of the first argument string that precedes the first occurrence of the second argument string in the first argument string, or the empty string if the first argument string does not contain the second argument string. For example, substring-before("1999/04/01","/") returns 1999. If the second argument string is the empty string, then the empty string is returned.

関数: string substring-after ( string, string )

substring-after 関数は、第2引数の文字列が第1引数の文字列の中に現れるならば、最初に現れる所より後の部分の第1引数の部分文字列を返す。 第2引数の文字列が第1引数の文字列の中に現れない場合は空文字列を返す。 例えば substring-after("1999/04/01","/")04/01 を返し、 substring-after("1999/04/01","19")99/04/01 を返す。 第2引数の文字列が空文字列だった場合、第1引数の文字列を返す。 The substring-after function returns the substring of the first argument string that follows the first occurrence of the second argument string in the first argument string, or the empty string if the first argument string does not contain the second argument string. For example, substring-after("1999/04/01","/") returns 04/01, and substring-after("1999/04/01","19") returns 99/04/01. If the second argument string is the empty string, then the first argument string is returned.

関数: string substring ( string, number, number ? )

substring 関数は、第1引数の文字列の中で、第2引数で指定される位置から始まり、第3引数で指定される長さの部分文字列を返す。 例えば substring("12345",2,3)"234" を返す。 第3引数が指定されなかった場合、第2引数で指定した位置から最後までの部分文字列を返す。 例えば substring("12345",2)"2345" を返す。 The substring function returns the substring of the first argument starting at the position specified in the second argument with length specified in the third argument. For example, substring("12345",2,3) returns "234". If the third argument is not specified, it returns the substring starting at the position specified in the second argument and continuing to the end of the string. For example, substring("12345",2) returns "2345".

より厳密には、文字列内の各文字は( [3.6 文字列] 参照)数としての位置を持つものと見なされる。 すなわち、最初の文字は1, 2番目の文字は2, 等々, 以下同様に続く。 More precisely, each character in the string (see [3.6 Strings]) is considered to have a numeric position: the position of the first character is 1, the position of the second character is 2 and so on.

注記: これは String.substring メソッドで最初の文字位置を0とみなす Java や ECMAScript とは異なる。 NOTE: This differs from Java and ECMAScript, in which the String.substring method treats the position of the first character as 0.

返り値の部分文字列は、文字位置が第2引数を丸めた値から(第3引数を指定した場合)第2引数を丸めた値と第3引数を丸めた値の和までの範囲に入る文字からなる。 ここで用いられる比較や加算は、標準の IEEE 754 規則に従う:数値の丸めは round 関数が呼び出されたかのように行われる。 様々な特殊な場合の例を以下に示す: The returned substring contains those characters for which the position of the character is greater than or equal to the rounded value of the second argument and, if the third argument is specified, less than the sum of the rounded value of the second argument and the rounded value of the third argument; the comparisons and addition used for the above follow the standard IEEE 754 rules; rounding is done as if by a call to the round function. The following examples illustrate various unusual cases:

  • substring("12345", 1.5, 2.6)"234" を返す。 substring("12345", 1.5, 2.6) returns "234"

  • substring("12345", 0, 3)"12" を返す。 substring("12345", 0, 3) returns "12"

  • substring("12345", 0 div 0, 3)"" を返す。 substring("12345", 0 div 0, 3) returns ""

  • substring("12345", 1, 0 div 0)"" を返す。 substring("12345", 1, 0 div 0) returns ""

  • substring("12345", -42, 1 div 0)"12345" を返す。 substring("12345", -42, 1 div 0) returns "12345"

  • substring("12345", -1 div 0, 1 div 0)"" を返す。 substring("12345", -1 div 0, 1 div 0) returns ""

関数: number string-length ( string ? )

string-length 関数は文字列に含まれる文字数を返す( [3.6 文字列] 参照)。 引数が省略された場合、文脈ノードを文字列に変換したもの、すなわち文脈ノードの 文字列値 が既定の引数として用いられる。 The string-length returns the number of characters in the string (see [3.6 Strings]). If the argument is omitted, it defaults to the context node converted to a string, in other words the string-value of the context node.

関数: string normalize-space ( string ? )

normalize-space 関数は、引数の文字列から空白を正規化して返す:先頭と末尾の空白は取り除かれ、連続する空白は1個のスペース文字に置換される。 空白とは、 XML の生成規則 S に一致する任意の文字列を指す。 引数が省略された場合、文脈ノードを文字列に変換したもの、すなわち文脈ノードの 文字列値 が既定の引数として用いられる。 The normalize-space function returns the argument string with whitespace normalized by stripping leading and trailing whitespace and replacing sequences of whitespace characters by a single space. Whitespace characters are the same as those allowed by the S production in XML. If the argument is omitted, it defaults to the context node converted to a string, in other words the string-value of the context node.

関数: string translate ( string, string, string )

translate 関数は、第1引数の文字列の中の各文字について、もしその文字が第2引数の文字列に含まれているなら、その文字を第3引数の文字列の中の(第2引数の文字位置に)対応する位置の文字に置換し、その結果の文字列を返す。 例えば translate("bar","abc","ABC")BAr を返す。 (第2引数の文字列が第3引数の文字列よりも長いなどの理由で)置換の際に第2引数の文字位置に対応する文字が第3引数の文字列に存在しない場合、第1引数の当該文字は削除される。 例えば translate("--aaa--","abc-","ABC")"AAA" を返す。 第2引数の文字列に同じ文字が複数含まれている場合、それらのうち最初の文字が置換する文字を決定する。 第3引数の文字列が第2引数の文字列よりも長い場合、余分な文字は無視される。 The translate function returns the first argument string with occurrences of characters in the second argument string replaced by the character at the corresponding position in the third argument string. For example, translate("bar","abc","ABC") returns the string BAr. If there is a character in the second argument string with no character at a corresponding position in the third argument string (because the second argument string is longer than the third argument string), then occurrences of that character in the first argument string are removed. For example, translate("--aaa--","abc-","ABC") returns "AAA". If a character occurs more than once in the second argument string, then the first occurrence determines the replacement character. If the third argument string is longer than the second argument string, then excess characters are ignored.

注記: この translate 関数は、すべての言語に満足に通用するような文字の大小変換を供するものではない。 XPath の将来版では文字の大小変換に利用できる追加の関数が考えられている。 NOTE: The translate function is not a sufficient solution for case conversion in all languages. A future version of XPath may provide additional functions for case conversion.

4.3 ブール関数

関数: boolean boolean ( object )

boolean 関数は、次のように引数をブール値に変換する: The boolean function converts its argument to a boolean as follows:

  • 数値は、正や負のゼロ, NaN のいずれでもない場合に限り真。 a number is true if and only if it is neither positive or negative zero nor NaN

  • ノード集合は空でない場合に限り真。 a node-set is true if and only if it is non-empty

  • 文字列は、長さがゼロでない場合に限り真。 a string is true if and only if its length is non-zero

  • 4つの基本型以外のオブジェクト型の場合、その型に応じた方法でブール値に変換される。 an object of a type other than the four basic types is converted to a boolean in a way that is dependent on that type

関数: boolean not ( boolean )

not 関数は、引数が偽ならば真、真ならば偽を返す。 【原文 "false otherwise" を文面のまま受け取ると例えば引数が数値の0でも偽を返すと解釈しそうだが、引数はまず関数の引数型に変換されることに注意。数値型の0はまずブール型の偽に変換されるので結果は真になる。】 The not function returns true if its argument is false, and false otherwise.

関数: boolean true()

true 関数は真を返す。 The true function returns true.

関数: boolean false()

false 関数は偽を返す。 The false function returns false.

関数: boolean lang ( string )

lang 関数は、 xml:lang 属性で指定されている文脈ノードの言語が引数に指定した言語と同じまたはその "副言語"(方言, 言語変種)になるとき、真を返す。 文脈ノードの言語は、文脈ノードの xml:lang 属性の値、あるいは、文脈ノードに xml:lang 属性が与えられていない場合は文脈ノードに最も近い先祖要素の xml:lang 属性の値から決定される。 そのような属性が与えられていない場合、 lang 関数は偽を返す。 そのような属性が与えられている場合、 lang 関数は文字の大小を区別せずに引数と比較し、属性値と引数が等しいか、あるいは属性値に文字 - で始まる接尾辞が含まれる場合はその接尾辞を無視した上で引数に等しくなるならば真を返す。 例えば、文脈ノードが次の5要素いずれであったとしても lang("en") は真を返す: The lang function returns true or false depending on whether the language of the context node as specified by xml:lang attributes is the same as or is a sublanguage of the language specified by the argument string. The language of the context node is determined by the value of the xml:lang attribute on the context node, or, if the context node has no xml:lang attribute, by the value of the xml:lang attribute on the nearest ancestor of the context node that has an xml:lang attribute. If there is no such attribute, then lang returns false. If there is such an attribute, then lang returns true if the attribute value is equal to the argument ignoring case, or if there is some suffix starting with - such that the attribute value is equal to the argument ignoring that suffix of the attribute value and ignoring case. For example, lang("en") would return true if the context node is any of these five elements:

<para xml:lang="en"/>
<div xml:lang="en"><para/></div>
<para xml:lang="EN"/>
<para xml:lang="en-us"/>

4.4 数値関数

関数: number number ( object ? )

number 関数は、次のように引数を数値に変換する: The number function converts its argument to a number as follows:

  • 空白(オプション), 負符号(オプション), Number, 空白(オプション)がこの順で連なる文字列は、( IEEE 754 の round-to-nearest 規則に従って)その文字列が表現する数学的値に最も近い IEEE 754 数値に変換される。 それ以外の文字列は NaN に変換される。 a string that consists of optional whitespace followed by an optional minus sign followed by a Number followed by whitespace is converted to the IEEE 754 number that is nearest (according to the IEEE 754 round-to-nearest rule) to the mathematical value represented by the string; any other string is converted to NaN

  • ブール値の真は 1, 偽は 0 に変換される。 boolean true is converted to 1; boolean false is converted to 0

  • ノード集合の場合、最初に string 関数を呼び出したかのように文字列に変換され、その文字列が引数が文字列の場合の変換と同じ方法で数値に変換される。 a node-set is first converted to a string as if by a call to the string function and then converted in the same way as a string argument

  • 4つの基本型以外の型のオブジェクトの場合、その型に応じた方法で数値に変換される。 an object of a type other than the four basic types is converted to a number in a way that is dependent on that type

引数が省略された場合、文脈ノード1個からなるノード集合が既定の引数として用いられる。 If the argument is omitted, it defaults to a node-set with the context node as its only member.

注記: number 関数を XML 文書の要素内の数値データの変換に用いるべきではない - 要素の型がそれらを言語中立な形式で表現するものでない限り(概して利用者への表示目的で言語特有の形式に変換されている)。 また、言語中立な形式であっても、 XPath の Number 構文と整合していなければ number 関数を用いることはできない。 NOTE: The number function should not be used for conversion of numeric data occurring in an element in an XML document unless the element is of a type that represents numeric data in a language-neutral format (which would typically be transformed into a language-specific format for presentation to a user). In addition, the number function cannot be used unless the language-neutral format used by the element is consistent with the XPath syntax for a Number.

関数: number sum ( node-set )

sum 関数は、引数に与えたノード集合に属する各ノードの 文字列値 を数値に変換し、それらの合計を返す。 The sum function returns the sum, for each node in the argument node-set, of the result of converting the string-values of the node to a number.

関数: number floor ( number )

floor 関数は、引数に与えた数値を越えない範囲で最も大きい(正の無限大に最も近い)整数を返す。 引数が NaN, 正の無限大, 負の無限大, 正のゼロ, 負のゼロの場合、引数と同じ値を返す。 引数がゼロより大きく 1 より小さい場合、正のゼロを返す。 The floor function returns the largest (closest to positive infinity) number that is not greater than the argument and that is an integer. If the argument is NaN, then NaN is returned. If the argument is positive infinity, then positive infinity is returned. If the argument is negative infinity, then negative infinity is returned. If the argument is positive zero, then positive zero is returned. If the argument is negative zero, then negative zero is returned. If the argument is greater than zero, but less than 1, then positive zero is returned.

関数: number ceiling ( number )

ceiling 関数は、引数に与えた数値を下回らない範囲で最も小さい(負の無限大に最も近い)整数を返す。 引数が NaN, 正の無限大, 負の無限大, 正のゼロ, 負のゼロの場合、引数と同じ値を返す。 引数がゼロより小さく -1 より大きい場合、負のゼロを返す。 The ceiling function returns the smallest (closest to negative infinity) number that is not less than the argument and that is an integer. If the argument is NaN, then NaN is returned. If the argument is positive infinity, then positive infinity is returned. If the argument is negative infinity, then negative infinity is returned. If the argument is positive zero, then positive zero is returned. If the argument is negative zero, then negative zero is returned. If the argument is less than zero, but greater than -1, then negative zero is returned.

関数: number round ( number )

round 関数は、引数に渡された値に最も近い整数を返す。 そのような数が2つ存在する場合、正の無限大に近い方を返す。 引数が NaN, 正の無限大, 負の無限大, 正のゼロ, 負のゼロの場合、引数と同じ値を返す。 引数がゼロより小さく -0.5 以上の場合、負のゼロを返す。 The round function returns the number that is closest to the argument and that is an integer. If there are two such numbers, then the one that is closest to positive infinity is returned. If the argument is NaN, then NaN is returned. If the argument is positive infinity, then positive infinity is returned. If the argument is negative infinity, then negative infinity is returned. If the argument is positive zero, then positive zero is returned. If the argument is negative zero, then negative zero is returned. If the argument is less than zero, but greater than or equal to -0.5, then negative zero is returned.

注記: 上記で、引数が負のゼロの場合と最後の場合の round 関数を呼び出した結果は 0.5 を加えてから floor 関数を呼び出した結果と同じにならない。 NOTE: For these last two cases, the result of calling the round function is not the same as the result of adding 0.5 and then calling the floor function.

5 データモデル

XPath は XML 文書をツリーとして扱う。 この節では、XPath が XML 文書をどのようにしてツリーにモデル化するかについて述べる。 このモデルは概念的なものであり、特定の実装を義務付けるものではない。 このモデルと XML 情報セット [XML Infoset] との関係については、[B XML 情報セットとの対応付け] で述べる。 XPath operates on an XML document as a tree. This section describes how XPath models an XML document as a tree. This model is conceptual only and does not mandate any particular implementation. The relationship of this model to the XML Information Set [XML Infoset] is described in [B XML Information Set Mapping].

XPath が扱う XML 文書は、XML 名前空間勧告 [XML Names] に準拠していなければならない。 XML documents operated on by XPath must conform to the XML Namespaces Recommendation [XML Names].

ツリーはノードを持ち、ノードには次の7種類がある: The tree contains nodes. There are seven types of node:

すべてのノード型に対し、その型のノードの 文字列値 を決定する手続きが定められている。 文字列値がそのノードの一部となるノード型もあれば、子孫ノードの文字列値から算出されるノード型もある。 For every type of node, there is a way of determining a string-value for a node of that type. For some types of node, the string-value is part of the node; for other types of node, the string-value is computed from the string-value of descendant nodes.

注記: 要素ノードやルートノードの場合、ノードの文字列値は DOM の nodeValue メソッド( [DOM] 参照)が返す文字列と同じではない。 NOTE: For element nodes and root nodes, the string-value of a node is not the same as the string returned by the DOM nodeValue method (see [DOM]).

一部のノード型は 展開名 を持つ。 展開名は局所部と名前空間 URI からなる。 局所部は文字列である。 名前空間 URI は null または文字列のいずれかである。 XML 文書において名前空間宣言により指定される 名前空間名[RFC2396] で定められるように URI 参照になるので、素片識別子を含み得るし、相対形式も可能である。 もし 展開名 が、(素片識別子も伴い得る)相対 URI の名前空間名を用いた名前空間宣言により宣言された接頭辞を持つ QName から展開されたものであった場合、その 展開名 の名前空間 URI は実装依存になる。 そのような 展開名 の名前空間 URI にふるまいが依存する XPath 式は、相互運用性に欠くことになる。 Some types of node also have an expanded-name, which is a pair consisting of a local part and a namespace URI. The local part is a string. The namespace URI is either null or a string. The namespace URI specified in the XML document can be a URI reference as defined in [RFC2396]; this means it can have a fragment identifier and can be relative. A relative URI should be resolved into an absolute URI during namespace processing: the namespace URIs of expanded-names of nodes in the data model should be absolute. Two expanded-names are equal if they have the same local part, and either both have a null namespace URI or both have non-null namespace URIs that are equal. A namespace name specified in a namespace declaration in an XML document is a URI reference as defined in [RFC2396]; this implies it can have a fragment identifier and can be relative. The namespace URI component of an expanded-name is implementation-dependent if the expanded-name is expanded from a QName whose prefix is declared by a namespace declaration with a namespace name that is a relative URI (with or without a fragment identifier). An XPath expression that depends on the value of the namespace URI component of such expanded-names is not interoperable.

文書内のすべてのノードに、 文書順 という順序付けが与えられる。 これは一般実体を展開した後の文書の XML 表現において、各ノードの XML 表現の最初の文字が現れる順序を表す。 従って、ルートノードが最初のノードになる。 要素ノードはそれ自身の子よりも先になる。 すなわち文書順において要素ノードは、(実体の展開後の) XML 内で要素ノードの開始タグが表れる順序により順序付けられる。 要素の属性ノードと名前空間ノードは、その要素の子ノードよりも先になる。 名前空間ノードは属性ノードよりも先になるものとする。 名前空間ノードの相対的順序、および、属性ノードの相対的な順序は実装依存になる。 逆文書順文書順を逆にしたものである。 There is an ordering, document order, defined on all the nodes in the document corresponding to the order in which the first character of the XML representation of each node occurs in the XML representation of the document after expansion of general entities. Thus, the root node will be the first node. Element nodes occur before their children. Thus, document order orders element nodes in order of the occurrence of their start-tag in the XML (after expansion of entities). The attribute nodes and namespace nodes of an element occur before the children of the element. The namespace nodes are defined to occur before the attribute nodes. The relative order of namespace nodes is implementation-dependent. The relative order of attribute nodes is implementation-dependent. Reverse document order is the reverse of document order.

ルートノードと要素ノードは、順序付けられた子ノードのリストを持つ。 複数のノードが1つの子ノードを共有することはない。 すなわち、異なる2つのノードに対し、一方のノードの子ノードともう一方のノードの子ノードはすべて互いに異なる。 ルートノードを除くすべてのノードは、必ず 親ノード を1つ持つ。 親ノードになるのはルートノードか要素ノードのどちらかである。 ルートまたは要素ノードはそのそれぞれの子ノードの親ノードになる。 ノードの 子孫ノード とは、そのノードの子ノード、および子ノードの子孫ノードになる。 Root nodes and element nodes have an ordered list of child nodes. Nodes never share children: if one node is not the same node as another node, then none of the children of the one node will be the same node as any of the children of another node. Every node other than the root node has exactly one parent, which is either an element node or the root node. A root node or an element node is the parent of each of its child nodes. The descendants of a node are the children of the node and the descendants of the children of the node.

5.1 ルートノード

ルートノードはツリーのルートであり、ツリーのルート以外にはならない。 文書要素に対応する要素ノードはルートノードの子ノードになる。 ルートノードの子には、プロローグ部や文書要素終了後に位置する処理命令やコメントに対応する処理命令ノードやコメントノードも含まれる。 The root node is the root of the tree. A root node does not occur except as the root of the tree. The element node for the document element is a child of the root node. The root node also has as children processing instruction and comment nodes for processing instructions and comments that occur in the prolog and after the end of the document element.

ルートノードの 文字列値 は、ルートノードのすべての子孫テキストノード文字列値 を文書順に連結したものである。 The string-value of the root node is the concatenation of the string-values of all text node descendants of the root node in document order.

ルートノードは 展開名 を持たない。 The root node does not have an expanded-name.

5.2 要素ノード

文書内のすべての要素に対し、対応する要素ノードがある。 要素ノードの 展開名 は、タグに指定した要素の QName を XML 名前空間勧告 [XML Names] に従って展開することにより得られる。 QName に接頭辞がなく、かつ、適用し得る既定の名前空間も与えられていない場合、要素の 展開名 の名前空間 URI は null になる。 There is an element node for every element in the document. An element node has an expanded-name computed by expanding the QName of the element specified in the tag in accordance with the XML Namespaces Recommendation [XML Names]. The namespace URI of the element's expanded-name will be null if the QName has no prefix and there is no applicable default namespace.

注記: [XML Names] の付録 A.3 の表記法では、展開名の局所部は ExpEType 要素の type 属性に対応し, 展開名の名前空間 URI は ExpEType 要素の ns 属性に対応する。 ExpEType 要素の ns 属性が省略された場合、名前空間 URI は null になる。 NOTE: In the notation of Appendix A.3 of [XML Names], the local part of the expanded-name corresponds to the type attribute of the ExpEType element; the namespace URI of the expanded-name corresponds to the ns attribute of the ExpEType element, and is null if the ns attribute of the ExpEType element is omitted.

要素ノードの子ノードは、その内容の要素ノードやコメントノード, 処理命令ノード, テキストノードである。 内部実体参照と外部実体参照は展開され、文字参照は解決される。 The children of an element node are the element nodes, comment nodes, processing instruction nodes and text nodes for its content. Entity references to both internal and external entities are expanded. Character references are resolved.

要素ノードの 文字列値 は、要素ノードのすべての 子孫テキストノード文字列値 を文書順に連結したものである。 The string-value of an element node is the concatenation of the string-values of all text node descendants of the element node in document order.

5.2.1 一意 ID

要素ノードは一意的な識別子 (ID) を持つ場合がある。 これは DTD 内で ID 型として宣言された属性の値である。 同じ文書内の任意の異なる2つの要素が同一の一意 ID を持つことはできない。 XML プロセッサが、1つの文書内に同一の一意 ID を持つ要素が2つある(これは文書が妥当でない場合にのみ起こりうる)ことを報告した場合、文書順で2番目の要素は一意 ID を持たないものとして扱われなければならない。 An element node may have a unique identifier (ID). This is the value of the attribute that is declared in the DTD as type ID. No two elements in a document may have the same unique ID. If an XML processor reports two elements in a document as having the same unique ID (which is possible only if the document is invalid) then the second element in document order must be treated as not having a unique ID.

注記: 文書が DTD を持っていない場合には、その文書内に一意 ID を持つ要素はない。 NOTE: If a document does not have a DTD, then no element in the document will have a unique ID.

5.3 属性ノード

それぞれの要素ノードは関連する属性ノードの集合を持つ。 要素はそれらの属性ノードの 親ノード になる。 しかしながら、属性ノードは、その親要素ノードの子ノードにはならない。 Each element node has an associated set of attribute nodes; the element is the parent of each of these attribute nodes; however, an attribute node is not a child of its parent element.

注記: これは DOM とは異なる。 DOM では、属性を持つ要素をその属性の親ノードとしては扱わない([DOM] 参照)。 NOTE: This is different from the DOM, which does not treat the element bearing an attribute as the parent of the attribute (see [DOM]).

要素が属性ノードを共有することはない。 すなわち、異なる2つの要素ノードに対し、一方に属する属性ノードともう一方に属する属性ノードはすべて互いに異なる。 Elements never share attribute nodes: if one element node is not the same node as another element node, then none of the attribute nodes of the one element node will be the same node as the attribute nodes of another element node.

注記: = 演算子は2つのノードが同じ値を持つかどうかをテストするためのものであり、それらが同じノードかどうかをテストするものではない。 従って、異なる要素の属性は同じノードでなくても = 演算子を用いて比較し得る。 NOTE: The = operator tests whether two nodes have the same value, not whether they are the same node. Thus attributes of two different elements may compare as equal using =, even though they are not the same node.

既定値を伴う属性は、属性を指定した場合と同等に扱われる。 一方、 DTD 内の要素型の属性宣言において、既定値が #IMPLIED として宣言されている場合、その属性は要素に指定されない限り、要素の属性集合には含まれない。 A defaulted attribute is treated the same as a specified attribute. If an attribute was declared for the element type in the DTD, but the default was declared as #IMPLIED, and the attribute was not specified on the element, then the element's attribute set does not contain a node for the attribute.

xml:langxml:space などの一部の属性は、他の子孫要素の同じ属性のインスタンスにより上書きされる場合を除き、その属性を適用し得る子孫要素すべてに対し効果が伝播する。 しかしながら、要素の属性は(開始または空要素)タグの中で明示的に指定されるか、 DTD において属性の既定値が明示的に宣言されない限りノードにならないので、この伝播によりツリー内に属性ノードが生成されるわけではない。 Some attributes, such as xml:lang and xml:space, have the semantics that they apply to all elements that are descendants of the element bearing the attribute, unless overridden with an instance of the same attribute on another descendant element. However, this does not affect where attribute nodes appear in the tree: an element has attribute nodes only for attributes that were explicitly specified in the start-tag or empty-element tag of that element or that were explicitly declared in the DTD with a default value.

属性ノードは 展開名文字列値 を持つ。 展開名 は、 XML 文書のタグ内に指定した要素の QName を XML 名前空間勧告 [XML Names] に従って展開することにより得られる。 属性の QName に接頭辞がない場合、その属性名の名前空間 URI は null になる。 An attribute node has an expanded-name and a string-value. The expanded-name is computed by expanding the QName specified in the tag in the XML document in accordance with the XML Namespaces Recommendation [XML Names]. The namespace URI of the attribute's name will be null if the QName of the attribute does not have a prefix.

注記: [XML Names] の付録 A.3 の表記法では、展開名の局所部は ExpAName 要素の name 属性に対応し, 展開名の名前空間 URI は ExpAName 要素の ns 属性に対応する。 ExpAName 要素の ns 属性が省略された場合、名前空間 URI は null になる。 NOTE: In the notation of Appendix A.3 of [XML Names], the local part of the expanded-name corresponds to the name attribute of the ExpAName element; the namespace URI of the expanded-name corresponds to the ns attribute of the ExpAName element, and is null if the ns attribute of the ExpAName element is omitted.

属性ノードは 文字列値 を持つ。 この 文字列値 は、XML 勧告 [XML] に規定される方法で正規化された値である。 正規化により長さゼロの文字列になったとしても特別に扱われることはない。 すなわち、 文字列値 が長さゼロの文字列の属性ノードとして扱われる。 An attribute node has a string-value. The string-value is the normalized value as specified by the XML Recommendation [XML]. An attribute whose normalized value is a zero-length string is not treated specially: it results in an attribute node whose string-value is a zero-length string.

注記: 属性の既定値は外部 DTD や外部パラメータ実体でも宣言され得る。 XML 勧告は、妥当性の検証を行わない XML プロセッサに対する外部 DTD や外部パラメータの読み込みを要求していない。 外部 DTD または外部のパラメータ実体で宣言される属性の既定値が XPath ツリーに含まれることを前提に組まれたスタイルシートや他の機能は、妥当性の検証を行わない XML プロセッサでは機能しない可能性がある。 NOTE: It is possible for default attributes to be declared in an external DTD or an external parameter entity. The XML Recommendation does not require an XML processor to read an external DTD or an external parameter unless it is validating. A stylesheet or other facility that assumes that the XPath tree contains default attribute values declared in an external DTD or parameter entity may not work with some non-validating XML processors.

名前空間を宣言する属性に対応する属性ノードはない( [XML Names] 参照)。 There are no attribute nodes corresponding to attributes that declare namespaces (see [XML Names]).

5.4 名前空間ノード

それぞれの要素は、対応付けられた名前空間ノードの集合を持つ。 集合に含まれる名前空間ノードのうち、1つは(もしあれば)要素のスコープに入る既定の名前空間に対応し、残りは要素のスコープに入る異なる名前空間接頭辞( XML 名前空間勧告 [XML Names] で暗黙的に宣言される xml 接頭辞も含む)に1つずつ対応するものになる。 要素はこれらの各名前空間ノードの 親ノード になる。 しかしながら、名前空間ノードはその親要素ノードの子ノードにはならない。 要素が名前空間ノードを共有することはない。 すなわち、異なる2つの要素ノードに対し、一方に属する名前空間ノードともう一方に属する名前空間ノードはすべて互いに異なる。 すなわち、要素には次に挙げるものに対応する名前空間ノードを持つことになる: Each element has an associated set of namespace nodes, one for each distinct namespace prefix that is in scope for the element (including the xml prefix, which is implicitly declared by the XML Namespaces Recommendation [XML Names]) and one for the default namespace if one is in scope for the element. The element is the parent of each of these namespace nodes; however, a namespace node is not a child of its parent element. Elements never share namespace nodes: if one element node is not the same node as another element node, then none of the namespace nodes of the one element node will be the same node as the namespace nodes of another element node. This means that an element will have a namespace node:

名前空間ノードは 展開名 を持ち、局所部は名前空間接頭辞になる(既定の名前空間に対応する名前空間ノードの場合は空になる)。 名前空間 URI は常に null になる。 A namespace node has an expanded-name: the local part is the namespace prefix (this is empty if the namespace node is for the default namespace); the namespace URI is always null.

名前空間ノードの 文字列値 は、名前空間接頭辞に結びつけられた名前空間 URI である。 XML 文書における名前空間宣言の名前空間名が(素片識別子も伴い得る)相対 URI だった場合、 文字列値 は実装依存になる。 そのような名前空間ノードの 文字列値 に依存する XPath 式は、相互運用性に欠くことになる。 The string-value of a namespace node is the namespace URI that is being bound to the namespace prefix; if it is relative, it must be resolved just like a namespace URI in an expanded-name. if the namespace name occurring in the namespace declaration in the XML document is a relative URI (with or without a fragment identifier), then the string-value is implementation-dependent. An XPath expression that depends on the string-value of such namespace nodes is not interoperable.

5.5 処理命令ノード

文書型宣言内に記述されるものを除き、すべての処理命令には対応する処理命令ノードが存在する。 There is a processing instruction node for every processing instruction, except for any processing instruction that occurs within the document type declaration.

処理命令は 展開名 を持ち、局所部は処理命令の処理対象である。 名前空間 URI は null になる。 処理命令ノードの 文字列値 は、処理命令のうち処理対象と空白に後続する部分になる。 最後の ?> はこの文字列値には含まれない。 A processing instruction has an expanded-name: the local part is the processing instruction's target; the namespace URI is null. The string-value of a processing instruction node is the part of the processing instruction following the target and any whitespace. It does not include the terminating ?>.

注記: XML 宣言は処理命令ではない。 従って XML 宣言に対応する処理命令ノードはない。 NOTE: The XML declaration is not a processing instruction. Therefore, there is no processing instruction node corresponding to the XML declaration.

5.6 コメントノード

文書型宣言内に記述されるコメントを除き、すべてのコメントには対応するコメントノードが存在する。 There is a comment node for every comment, except for any comment that occurs within the document type declaration.

コメントの 文字列値 はコメントの内容である。 先頭の <!-- と末尾の --> は内容に含まれない。 The string-value of comment is the content of the comment not including the opening <!-- or the closing -->.

コメントノードは 展開名 を持たない。 A comment node does not have an expanded-name.

5.7 テキストノード

文字データはテキストノードにグループ化される。 各テキストノードには可能な限り多くの文字データがグループ化される。 すんわち、テキストノードの直前または直後にテキストノードの同胞ノードが来ることはない。 テキストノードの 文字列値 はその文字データである。 テキストノードは常に少なくとも1文字のデータを持つ。 Character data is grouped into text nodes. As much character data as possible is grouped into each text node: a text node never has an immediately following or preceding sibling that is a text node. The string-value of a text node is the character data. A text node always has at least one character of data.

CDATA セクション内の各文字は文字データとして扱われる。 従って、ソース文書内の <![CDATA[<]]>&lt; と同等の扱いになり、いずれも、ツリー内では1つの < 文字からなるテキストノードになる。 すなわち CDATA セクションは <![CDATA[]]> を削除し、すべての <& をそれぞれ &lt;&amp; に置き換えたかのように扱われる。 Each character within a CDATA section is treated as character data. Thus, <![CDATA[<]]> in the source document will treated the same as &lt;. Both will result in a single < character in a text node in the tree. Thus, a CDATA section is treated as if the <![CDATA[ and ]]> were removed and every occurrence of < and & were replaced by &lt; and &amp; respectively.

注記: 文字 < からなるテキストノードを XML として書き出す場合、たとえば &lt; を用いるか、あるいは文字 < を CDATA セクションにくるんで < 文字をエスケープしなければならない。 NOTE: When a text node that contains a < character is written out as XML, the < character must be escaped by, for example, using &lt;, or including it in a CDATA section.

コメント, 処理命令, 属性値に含まれる文字はテキストノードを生成しない。 外部実体の改行は XML 勧告 [XML] に従って #xA に正規化される。 Characters inside comments, processing instructions and attribute values do not produce text nodes. Line-endings in external entities are normalized to #xA as specified in the XML Recommendation [XML].

文書要素の外側の空白はテキストノードを生成しない。 Whitespace outside the document element does not produce text nodes.

テキストノードは 展開名 を持たない。 A text node does not have an expanded-name.

6 適合性

XPath は、主に他の仕様からの部品としての利用が意図されている。 従って XPath の実装に際しての適合性基準は、 XPath を利用する仕様( [XPointer][XSLT] など) に依存する形で決まるため、独立の XPath 実装に対する適合性基準は定めない。 XPath is intended primarily as a component that can be used by other specifications. Therefore, XPath relies on specifications that use XPath (such as [XPointer] and [XSLT]) to specify criteria for conformance of implementations of XPath and does not define any conformance criteria for independent implementations of XPath.


A 参照文献

A.1 参照文献(規定)

IEEE 754
Institute of Electrical and Electronics Engineers.
IEEE Standard for Binary Floating-Point Arithmetic.
ANSI/IEEE Std 754-1985.
RFC2396
T. Berners-Lee, R. Fielding, and L. Masinter.
Uniform Resource Identifiers (URI): Generic Syntax.
IETF RFC 2396. See http://www.ietf.org/rfc/rfc2396.txt.
XML
World Wide Web Consortium.
Extensible Markup Language (XML) 1.0.
W3C Recommendation. See http://www.w3.org/TR/1998/REC-xml-19980210
XML Names
World Wide Web Consortium.
Namespaces in XML.
W3C Recommendation. See http://www.w3.org/TR/REC-xml-names
XML 1.1
World Wide Web Consortium.
Extensible Markup Language (XML) 1.1.
W3C Recommendation. See http://www.w3.org/TR/xml11/
XML Names 1.1
World Wide Web Consortium.
Namespaces in XML 1.1.
W3C Recommendation. See http://www.w3.org/TR/xml-names11/

A.2 その他の参照文献

Character Model
World Wide Web Consortium.
Character Model for the World Wide Web.
W3C Working Draft. See http://www.w3.org/TR/WD-charmod
DOM
World Wide Web Consortium.
Document Object Model (DOM) Level 1 Specification.
W3C Recommendation. See http://www.w3.org/TR/REC-DOM-Level-1
JLS
J. Gosling, B. Joy, and G. Steele.
The Java Language Specification. See http://java.sun.com/docs/books/jls/index.html
ISO/IEC 10646
ISO (International Organization for Standardization).
ISO/IEC 10646-1:1993, Information technology -- Universal Multiple-Octet Coded Character Set (UCS) -- Part 1: Architecture and Basic Multilingual Plane.
International Standard. See http://www.iso.ch/cate/d18741.html
TEI
C.M. Sperberg-McQueen, L. Burnard.
Guidelines for Electronic Text Encoding and Interchange.
See http://etext.virginia.edu/TEI.html
Unicode
Unicode Consortium.
The Unicode Standard.
See http://www.unicode.org/unicode/standard/standard.html
XML Infoset
World Wide Web Consortium.
XML Information Set.
W3C Working Draft. W3C Recommendation. See http://www.w3.org/TR/xml-infoset
XPointer
World Wide Web Consortium.
XML Pointer Language (XPointer).
W3C Working Draft. See http://www.w3.org/TR/WD-xptr
XQL
J. Robie, J. Lapp, D. Schach.
XML Query Language (XQL).
See http://www.w3.org/TandS/QL/QL98/pp/xql.html
XSLT
World Wide Web Consortium.
XSL Transformations (XSLT).
W3C Recommendation. See http://www.w3.org/TR/xslt

B XML 情報セットとの対応付け(規定外)

【この章の内容は 正誤表 により章全体が新しい内容に書き換えられている。 当訳ではその新しい方を掲載する。 元の内容は原文を参照されたし。 】

XPath データモデルのノードは、XML 情報セット [XML Infoset] の情報項目( information items )に対応付けられる。 それぞれの対応関係は次のようになる。 The nodes in the XPath data model can be derived from the information items provided by the XML Information Set [XML Infoset] as follows:

B.1 ルートノード

XPath データモデルのインスタンスはルートノードをきっかり1つ含む。 ルートノードは XML 情報セット内で一意的になる文書情報項目に対応する。 An instance of the XPath Data Model contains exactly one root node, which corresponds to the unique document information item in an XML Information Set.

B.2 要素ノード

要素ノードは要素情報項目に対応する。 An element node corresponds to an element information item.

B.3 属性ノード

属性ノードは 属性情報項目に対応する。 名前空間宣言は属性としてモデル化されない。 An attribute node corresponds to an attribute information item. Namespace declarations are not modelled as attributes.

B.4 テキストノード

テキストノードは1個以上の連続する 文字情報項目 に対応する。 A text node corresponds to a sequence of one or more consecutive character information items.

B.5 処理命令ノード

処理命令ノードは 処理命令情報項目 に対応する。 文書型宣言情報項目の子の処理命令には対応する処理命令ノードは存在しない。 A processing instruction node corresponds to a processing instruction information item. There are no processing instruction nodes for processing instructions that are children of a document type declaration information item.

B.6 コメントノード

コメントノードは コメント情報項目 に対応する。 A comment node corresponds to a comment information item.

B.7 名前空間ノード

名前空間ノードは 名前空間情報項目 に対応する。 A namespace node corresponds to a namespace information item.

B.8 XML 情報セットへの適合性

この仕様は XML 情報セット [XML Infoset] に適合する。 データモデルのインスタンスの構築にあたっては、情報セットプロセッサから以下の情報項目が抽出されなければならない: This specification conforms to the XML Information Set [XML Infoset]. The following information items must be exposed by the infoset producer to construct an instance of the data model:

情報セットプロセッサから利用可能な他のすべての情報項目とプロパティは無視される。 Any other information items and properties made available by the Infoset processor are ignored.