0
我遇到了HtmlUnit解析器的问题,我试图从网站中抓取一些XML(使用网站的API),对结果XML进行快速解析,然后将XML保存到文件中(所有内部API的权利)。 (sample content)如何为HtmlUnit XML解析器定义一个新的实体?
不幸的是,网站中的一些请求页面的返回实体¿
,虽然这是一个有效的HTML实体的HtmlUnit是分析过程中的与消息抛出一个异常:
实体“iquest “被引用,但未被宣布。
如何将iquest
定义为有效实体?
不够公平。我希望能够截取流并使用HtmlUnit解析器,而不是我正在接受的内容在这些无效的实体被剥离的情况下,在HU框架之外解析它。 – 2010-06-28 18:56:06