4
我使用BeautifulSoup正确解码/编码字符串,我回来一个字符串是这样的:Unicode的问题,蟒蛇
u'Dassault Myst\xe8re'
这是一个unicode的,但我要的是使它看起来像:
'Dassault Mystère'
我已经试过
name = name.encode('utf-8'), decode(), unicode()
我不断收到的错误是:
UnicodeEncodeError: 'ascii' codec can't encode character u'\xe8'
我的默认编码似乎是 'ASCII':sys.getdefaultencoding()返回 'ASCII' 即使我有:
#!/usr/bin/env python
# encoding: utf-8
在文件的顶部。
希望一劳永逸地解决这个反复出现的Unicode问题!
感谢
那么,这固定打印到控制台问题。 但是当我建立一个url时,我仍然有一个问题,因为当我发出一个http请求时,在它上面追加 - u'Dassault Myst \ xe8re'url urllib2扼流器。我猜这是期待一个ascii字符串,而我正在发送别的东西? – Maverick 2011-03-12 22:44:42
我的网址看起来像这样:u'http://www.youtube.com/results?search_query = Dassault + Myst \ xe8re&aq = 0' 和urllib2并不喜欢它。 – Maverick 2011-03-12 22:47:27
第二部分解决使用这个答案︰http://stackoverflow.com/questions/4389572/how-to-fetch-a-non-ascii-url-with-python-urlopen – Maverick 2011-03-12 22:55:11