嗨,我有一个文档,我试图提取一个日期。但是问题出现在节点中,并且它们的日期也是一些文本。类似于xpath帮助子串表达式
<div class="postHeader">
Posted on
July 20, 2009 9:22 PM PDT
</div>
从这个标记我只是希望日期项目不是张贴在文本上。像
./xhtml:div[@class ='postHeader'] 正在获得一切。确切地说,我拥有的文档基本上是这个元素的一个节点列表,例如,我将获得具有不同日期值的这些元素的10个节点,但更糟的是问题是在这些标签内的某个时间点,一些随机的其他标签也像锚点一样弹出我们等等。我可以写一个通用expath,它只会从div标签中获取日期吗?
那么,所有'postHeader'内部的文本节点可以完全不同? – Oded 2010-04-27 16:54:56
是的,但每分钟。他们可能有一个额外的''标签或'
''但多数民众赞成它,所有postHeader有一个肯定的日期 – 2010-04-27 16:58:27