2010-04-27 99 views
1

嗨,我有一个文档,我试图提取一个日期。但是问题出现在节点中,并且它们的日期也是一些文本。类似于xpath帮助子串表达式

<div class="postHeader"> 
Posted on 
    July 20, 2009 9:22 PM PDT 

    </div> 

从这个标记我只是希望日期项目不是张贴在文本上。像
./xhtml:div[@class ='postHeader'] 正在获得一切。确切地说,我拥有的文档基本上是这个元素的一个节点列表,例如,我将获得具有不同日期值的这些元素的10个节点,但更糟的是问题是在这些标签内的某个时间点,一些随机的其他标签也像锚点一样弹出我们等等。我可以写一个通用expath,它只会从div标签中获取日期吗?

+0

那么,所有'postHeader'内部的文本节点可以完全不同? – Oded 2010-04-27 16:54:56

回答