我试图选择元素(a)与XPath 1.0(或可能与正则表达式),它们跟随特定元素(b)的同胞,但仅在另一个b元素之前。XPath“之后的兄弟姐妹”
<img><b>First</b><br>
<img> <a href="/first-href">First Href</a> - 19:30<br>
<img><b>Second</b><br>
<img> <a href="/second-href">Second Href</a> - 19:30<br>
<img> <a href="/third-href">Third Href</a> - 19:30<br>
我试着让样本尽可能接近现实世界。因此,在这种情况下,当我在元素
<b>First</b>
,我需要选择
<a href="/first-href">First Href</a>
,当我在
<b>Second</b>
,我需要选择
<a href="/second-href">Second Href</a>
<a href="/third-href">Third Href</a>
任何想法如何实现?谢谢!
我们可以假设xml格式正确吗?br''元素实际上是'
'?此外'img'元素有内容并以'/>'结尾?如果“真实世界”包含格式良好的XML(如果不是XPath不是一种选择),它确实会有所帮助。 – AnthonyWJones 2010-02-17 12:54:25
作为真实世界的例子,当然它不是很好的形成。我希望它是:(但是,我使用Html Agility Pack(.NET)来处理标记,并且它容忍格式不正确的文档,如果有任何帮助的话。 – 2010-02-17 13:14:49
没有理由认为“真实世界”意味着mal -xml。有很多html提供的例子以及XML格式。当然,你提到的敏捷性问题会让情景变得更加清晰,增加适当的标签。 – AnthonyWJones 2010-02-17 18:42:13