2014-01-17 59 views
0

我有一个关于XPath表达式的W3C规范(EBNF表示法)的初学者问题。该规范可在以下网址找到:http://www.w3.org/TR/xpath/。特别是我有一个关于理解以下表达式的问题:解析XPath表达式了解EBNF生产规则

(//attribute::name | //attribute::id)[starts-with(string(self::node()), "be") or starts-with(string(self::node()), "1")] 

这似乎是一个有效的表达式。我验证了使用http://www.freeformatter.com/xpath-tester.html与下面的XML文档:

<documentRoot> 
<!-- Test data --> 
<?xc value="2" ?> 
<parent name="data" > 
    <child id="1" name="alpha" >Some Text</child> 
    <child id="2" name="beta" > 
     <grandchild id="2.1" name="beta-alpha" ></grandchild> 
     <grandchild id="2.2" name="beta-beta" ></grandchild> 
    </child> 
    <pet name="tigger" type="cat" > 
     <data> 
     <birthday month="sept" day="19" ></birthday> 
     <food name="Acme Cat Food" ></food> 
     </data> 
    </pet> 
    <pet name="Fido" type="dog" > 
     <description> 
     Large dog! 
     </description> 
     <data> 
     <birthday month="feb" day="3" ></birthday> 
     <food name="Acme Dog Food" ></food> 
     </data> 
    </pet> 
    <rogue name="is this real?" > 
     <data> 
     Hates dogs! 
     </data> 
    </rogue> 
    <child id="3" name="gamma" mark="yes" > 
     <!-- A comment --> 
     <description> 
     Likes all animals - especially dogs! 
     </description> 
     <grandchild id="3.1" name="gamma-alpha" > 
     <![CDATA[ Some non-parsable character data ]]> 
     </grandchild> 
     <grandchild id="3.2" name="gamma-beta" ></grandchild> 
    </child> 
</parent> 
</documentRoot> 

这给了我下面的结果:

Attribute='id="1"' 
Attribute='name="beta"' 
Attribute='name="beta-alpha"' 
Attribute='name="beta-beta"' 

这是我不太清楚这EBNF作品的顺序会产生上面的查询。

感谢您的帮助。

回答

1

我不知道如何正确地表现这一点,但Expr >>> FilterExpr Predicate

Expr > OrExpr > AndExpr > EqualityExpr > RelationalExpr > AdditiveExpr > MultiplicativeExpr > UnaryExpr > UnionExpr > PathExpr > FilterExpr > FilterExpr Predicate 

为您提供了2个部分:

  • 过滤(//attribute::name | //attribute::id)
  • 和谓词[starts-with(string(self::node()), "be") or starts-with(string(self::node()), "1")]

(//attribute::name | //attribute::id)

FilterExpr > PrimaryExpr > '(' Expr ')' 
Expr > OrExpr > AndExpr > EqualityExpr > RelationalExpr > AdditiveExpr > MultiplicativeExpr > UnaryExpr > UnionExpr > UnionExpr '|' PathExpr 

给你//attribute::name//attribute::id

//attribute::name//attribute::id

PathExpr > LocationPath > AbsoluteLocationPath > AbbreviatedAbsoluteLocationPath > '//' RelativeLocationPath 
RelativeLocationPath > Step > AxisSpecifier NodeTest Predicate* 
    - AxisSpecifier > AxisName '::' 
     - AxisName > 'attribute' 
    - NodeTest > NameTest 

NameTestnameid

谓词[starts-with(string(self::node()), "be") or starts-with(string(self::node()), "1")]

Predicate > '[' PredicateExpr ']' > Expr > OrExpr > OrExpr 'or' AndExpr 
    - OrExpr > AndExpr 
    - AndExpr > EqualityExpr > RelationalExpr > AdditiveExpr > MultiplicativeExpr > UnaryExpr > UnionExpr > PathExpr > FilterExpr > PrimaryExpr > FunctionCall > FunctionName '(' (Argument (',' Argument)*)? ')' 
     Argument > Expr 

FunctionNamestarts-with,第一个参数是另一个FunctionCallstring功能),第二个参数是Literal S(经由PathExpr > FilterExpr > PrimaryExpr), “是” 和 “1”。

最后,自::节点()来源于:

RelativeLocationPath > Step > AxisSpecifier NodeTest Predicate* 
    - AxisSpecifier > AxisName '::' 
     - AxisName > 'attribute' 
    - NodeTest > NodeType '(' ')' 

NodeType被 '节点'

+0

太棒了!现在我懂了。非常感谢。我完全错过了FilterExpression规则。我被卡住了“Step = AxisSpecifier NodeTest Predicate”。很快,很好的答复! – user1362700

2

击穿:

 
(      # group 
    //attribute::name  # the long form of //@name 
    |      # union 
    //attribute::id  # the long form of //@id 
)      # group end 
[      # predicate (think "where") 
    starts-with(   # returns true or false 
    string(    #  returns a string 
     self::node()  #  the long form of "." 
    ),     # ) 
    "be"     #  a string literal 
)      # ) 
    or      # logical operator 
    starts-with(   # ...idem 
    string(    # 
     self::node()  # 
    ),     # 
    "1"     # 
)      # 
]      # end predicate 

所以表达式是

(//@name | //@id)[starts-with(., "be") or starts-with(., "1")] 

相当不必要详细的版本选择命名"name""id"其值开始"be""1"

所有属性我不知道你为什么要这个EBNF作品(家庭作业,我假设),但理解表达本身可能会帮助你。

一些额外的注意事项:

  • attribute::指定属性
  • 轴可以在任何node test之前(默认轴始终为child::)。
  • self::是特殊的,它只包含有问题的节点。 self::node()的简写形式是点(.)。其含义是,如果有问题的节点是<foo>节点,则self::foo将与其匹配,而self::bar则不会。
  • ///descendant-or-self::node()/
  • 速记的string()功能是多余的,因为starts-with()将其参数转换为字符串隐含反正。
  • 联合运算符加入两个节点集。出现在两组中的节点在结果中不重复。
  • 谓词应用于节点集中的每个节点,并对其进行有效过滤。
+1

要学究''//为'/后代或自身的简写:: node()/',而不是'/ descendant ::'(true,在许多情况下,区别并不重要,但有些情况下它很重要,例如,使得// @ foo明确定义,或者'// * [1]'和'/ descendant :: * [1]'之间的区别) –

+0

@Ian谢谢! - 更迂腐的是,''/''是'/ descendant-or-self ::'的缩写 - 毫无疑问,但仅此而已。 'node()'不是它的一部分。 :) – Tomalak

+3

不,'//'意思是'/ descendant-or-self :: node()/',包括前后斜线([XPath spec§2.5](http://www.w3.org/TR /的xpath /#路径缩写))。否则,你将无法像'// foo'那样说'/ descendant :: attribute :: foo'(你不能在同一个位置步骤中使用两个坐标轴)。 –