我想下载page_source到一个文件。然而,每一次我得到一个:没有Python unicode错误下载html
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc2 (or something else) in
position 8304: ordinal not in range(128)
我使用value.encode('utf-8')
尝试过,但似乎每次抛出同样的异常时间(除了手动试图取代所有的非ASCII字符)。有没有一种方法可以“预处理”HTML以将其变为“可写”格式?
什么是文件的实际编码? – 2012-01-09 03:11:08
使用UTF8 _而不是_ ASCII。 – SLaks 2012-01-09 03:15:09