回答
jsoup, Java HTML Parser与jQuery的语法方式非常相似。
它是否执行XPath查询? – 2010-07-30 01:08:20
我不确定。它执行更简单的查询,这是基于xpath的。你可以阅读一些文档,并且有很多很酷的例子,解释如何运行这些查询。 – 2010-07-31 08:17:56
jsoup(至少在版本1.7.3中)不支持XPath。 – prasopes 2014-01-11 20:30:22
我已经使用JTidy将HTML制作成适当的DOM,然后使用普通的XPath来查询DOM。
如果您想要进行跨文档/跨URL查询,最好将JTidy与XQuery一起使用。
去尝试一下。 – 2010-07-30 01:09:05
您可以使用TagSoup与撒克逊一起。通过这种方式,您可以简单地替换任何与TagSoup一起使用的XML SAX解析器,XPath 2.0或XSLT 2.0或XQuery 1.0实现像往常一样工作。
即将尝试。 – 2010-07-30 01:08:47
有几种不同的方法来此文件在网络上:
- HtmlCleaner/Java的DOM解析器 - Using XPath Contains against HTML in Java(这是我的方式推荐)
- HtmlCleaner本身具有内置支持XPath的实用程序 - 查看javadocs http://htmlcleaner.sourceforge.net/doc/org/htmlcleaner/XPather.html或本示例http://thinkandroid.wordpress.com/2010/01/05/using-xpath-and-html-cleaner-to-parse-html-xml/
使用Jericho
我曾尝试这些方法,即的HTMLParser加上Java的DOM解析器,并JSoup加Jaxen的,但效果最好的组合的几个不同的变化是HtmlCleaner加上Java DOM解析器。下一个最好的组合是杰里科加Jaxen。
- 1. 查询的HTML页面使用XPath在Java中
- 2. 的Java Xpath查询
- 3. 从Java中的XPath查询中检索裸露的html
- 4. HTML 4.0实体XPath查询
- 5. 使用XPath查询HTML文档
- 6. 使用XPath查询html标记
- 7. 数据库XPath查询
- 8. XPath查询和HTML - 在锚标签中查找特定的HREF
- 9. HTML页面上的Xpath查询 - 语法?
- 10. 格式错误的HTML和XPath查询
- 11. 使用XPath在Java中使用Android SDK查询xml资源
- 12. XPath查询中使用Python
- 13. 使用XPath查询
- 14. XPath查询SimpleXML中
- 15. 将XPath查询应用到Java中的SOAPMessage中
- 16. 在XPath查询中使用条件
- 17. Dom和xpath查询为html解析
- 18. JMeter中的XPath查询
- 19. 在java中使用xpath查找节点
- 20. 如何处理SQL查询的XPath,而编程在Java中
- 21. 如何在Java中执行类型安全的Xpath查询?
- 22. PHP XPath查询
- 23. XPATH查询值
- 24. 查询xpath,xml
- 25. XPath查询
- 26. XSLT XPath查询
- 27. XML XPath查询
- 28. 如何通过Xpath在Selenium中查询HTML元素?
- 29. 使用XPath查询值
- 30. php xpath:查询结果内的查询
请参阅http://stackoverflow.com/questions/9022140/using-xpath-contains-against-html-in-java-不完全重复,因为它会询问特定的XPath功能,但那里有更好的答案。 – 2013-01-07 00:34:58
@Reonarudo我和你问这个问题时的情况一样。答案中有很多可能的建议/解决方案,但我想知道您使用了哪种解决方案(库),是否按照您希望的方式工作? – 2015-06-20 19:08:10
@UtherPendragon对不起,但这是很久以前,我不记得哪个项目是这样的。无论如何,现在应该有更新/更好的图书馆。 – 2015-06-23 12:14:52