2012-03-13 95 views
0

我正在使用Java和SAX从搜索引擎实现RSS搜索功能。然而,某些搜索结果不是完整的,即一些条目的<title>标签的主体包含&字符而不是&amp;等(例如,比方说,Starsky & Hutch)。java sax解析不正常xml

解析RSS时,我得到一个org.apache.harmony.xml.ExpatParser&ParseException,导致整个搜索中断并返回任何内容。

我想让我的解析器解决这些错误,就像Firefox的RSS阅读器一样。解决这个问题并解析RSS提要的可能性有哪些?

+0

RSS提要解析器如何? http://stackoverflow.com/search?q=%5Bjava%5D+rss+parser – 2012-03-13 17:26:10

+0

如果格式不正确,那么它不是RSS提要。一个迂腐点,但却是至关重要的一点。 – skaffman 2012-03-13 17:42:09

+0

@skaffman我同意你的意见。但是这让我别无选择,只能放弃这种饲料。太糟糕了,尽管这是他们的错 – Gabriel 2012-03-13 18:08:08

回答

1

SAX实现通常用于检测错误和抛出异常,并且没有标准的方法来解决这个问题。我能想到的最合理的事情是在流式传输到SAX之前尝试修补错误,如流浪&字符。