产生了一些的XPath我使用HtmlCleaner2.1库,用于评估通过对HTML XPather插件生成的,从它的内容拼凑而成的XPath。但有时候,HtmlCleaner无法评估xpath。HtmlCleaner未能通过XPather
对于e.x. http://www.megaoutdoors.co.uk/norwegen-army-shirt-zipped-roll-top-collar-278-p.asp
有关产品的标题,由给定XPather XPath是// body/div [11]/div [6]/div [2]/form/div [1]/h1 但是,当我使用HtmlCleaner评估它时,会失败。
我们如何解决这个问题。当htmlcleaner清理它时页面的结构发生了变化吗?
感谢
Jitendra
@Jitendra:一般来说,对于文档声称XHTML验证是不合格的XML,这不是一个好的设计选择。 – 2010-12-21 15:48:43
它以哪种方式失败? (例如错误信息,获取错误的数据,没有数据......) – LarsH 2010-12-21 17:04:14