2012-02-22 64 views
0

这是个好主意吗?那么我已经使用了像JSoup这样的其他第三方库,它效果很好,但是对于这个项目来说它是不同的。当您只想从中获取一个项目时,是否值得加载和解析整个文档?一些html页面也很简单,所以我也可以使用String方法。原因是导致内存将成为问题,并且也需要一些时间来加载文档。当解析XML我一直使用SAX解析器,因为它不会在内存中加载它,它是快速的。我可以在html文档上使用相同的东西吗,或者在那里已经有这样一个?所以如果有一个非DOM的HTML轻量级解析器,那也会很棒。使用纯String方法的Java Parser HTML?

+0

只是一个念头,也许是操作系统可以为您更快做的工作,如果你正在寻找一个字符串。某种与正则表达式的grep,取决于您的环境 – 2012-02-22 19:35:41

+0

那么它的主要将是在Android的 – 2012-02-22 20:02:55

+0

我真的不知道关于Android任何事情,但我没有找到[这里](http://www.freeyourandroid.com/guide/ Linux的UNIX壳命令,Android)和[这](http://forum.xda-developers.com/showthread.php?t=1509517) – 2012-02-22 21:17:15

回答

1

如果HTML是XML标准(即它的XHTML),那么你可以使用标准的SAX解析器。在这里,你可以找到在Java的HTML解析器的列表可供选择:http://java-source.net/open-source/html-parsers。 HotSax可能会处理您的所有用例。

+0

感谢我会给那些一试 – 2012-02-23 01:52:55

相关问题