2009-11-26 69 views
1

如何在android中解析格式不正确的HTML?如何在android中解析(非格式良好的)HTML?

我试图用XOM和TagSoup,但在创建生成器时,我得到以下错误:

11-26 20:42:39.294: ERROR/dalvikvm(1298): Could not find method org.apache.xerces.impl.Version.getVersion, referenced from method nu.xom.Builder. 

,我必须安装的Xerces使用XOM或者我可以使用tagsoup没有XOM?

回答

2

您可能会发现JTidy(http://jtidy.sourceforge.net/) - HTMLTidy的端口要足够轻巧。它根据请求输出XHTML

+0

Glad它是有益的 – 2009-11-28 12:44:08

0

XOM可能需要Xerces在类路径中 - 它可能取决于Java的版本。目前我们使用

xercesImpl-2.8.0.jar 
+1

我认为Xerces本身太重,无法在Android上工作... 我不明白为什么我没有找到关于这样一个基本的东西,如Android的HTML刮...的信息... – Kristof 2009-11-26 22:14:15