2010-01-21 83 views
1

我解析rss feed.But我可以解析来自rss feed的编码数据。如何解析rss feed的编码数据?如何解析rss提要中的编码数据?

+0

你是什么意思“编码数据”?你的意思是XML吗? – 2010-01-21 05:40:04

+0

YES是正确的。它是一个XML。 – 2010-01-21 06:52:10

回答

0

这是一项艰巨的任务。 feedparser(Python)做了很多事情来尝试正确地猜测正确的字符集。有几个地方可以提供它 - 例如XML的头部和HTTP事务的头部(它覆盖了XML的头部)。如果它不存在(或者完全无效,这很常见),它会回到统计猜测。最后一种技术 - 尝试将其转换为UTF-8,如果失败,请将其从ISO-8859-1转换为UTF-8,然后重试。祝你好运!