2011-12-12 88 views

回答

2

对于HTML解析,我建议jsoup

jsoup是一个Java库与现实世界的HTML工作。它为 提供了一个非常方便的API,用于提取和操作数据,使用最好的DOM,CSS和类似jquery的方法。

jsoup实现了WHATWG HTML5规范,并且将HTML解析为 与现代浏览器相同的DOM。

+0

嗯,这似乎是有前途的。你有没有关于这与[Jericho](http://jericho.htmlparser.net/docs/index.html)相比的信息? – deiga

+0

没有,但afaik jsoup就像是HTML解析的事实标准。 – helpermethod