我已经阅读了几个关于python如何处理unicode的SO问题和博客帖子,但我仍然有点困惑。我正在通过scrapy进行研究,并从网页上获得这个信息:u'Isla de Se\xf1orita'
。它应该是u'Isla de Señorita'
。我知道我可以做点像..Python Unicode:我可以找回我的?
>>> u"ñ"
u'\xf1'
>>> u"ñ".encode("utf-8")
'\xc3\xb1'
但是我应该怎么做呢?我可以从这些字节中取出u"ñ"
吗?我只想要 - 这样我就可以将它保存到django模型中的一个字段中。谢谢。
Python正试图在这里有所帮助,并产生ASCII友好的调试输出。 ñ是Unicode中的U + 00F1,因此Python会显示'\ xf1'来指示值,这种方式在复制并粘贴到无法处理任何内容但不支持ASCII的终端或编辑器时不会失效。 – 2014-12-05 20:58:08