所以我有这个页面:如何检查一个Python unicode字符串以查看它*实际*是否是正确的Unicode?
http://hub.iis.sinica.edu.tw/cytoHubba/
显然,它是各种搞砸,因为它得到正确解码,但是当我尝试将其保存在Postgres里,我得到:
DatabaseError: invalid byte sequence for encoding "UTF8": 0xedbdbf
的数据库在此之后掀起轩然大波,并拒绝没有回滚的任何事情,这将会有点难以发布(长篇故事)。有没有办法让我来检查它是否会在它碰到数据库之前发生? source.encode(“utf-8”)工作顺利,所以我不知道发生了什么事...
你确定你的连接设置为使用UTF-8吗? – Wolph 2010-08-15 12:50:10
是的,30万其他网页加入就好了,只是这一个失败... – 2010-08-15 13:23:41