0
我的代码在这里:编码的问题()一个GBK页面
# coding:utf-8
if __name__ == '__main__':
from urllib2 import urlopen
url = 'http://iccna.blog.sohu.com/164572951.html'
data = urlopen(url).read()
soup = BeautifulSoup(data,fromEncoding='gb18030')
print WebExtractor(soup)
,但在调试时,这样的数据:
��5h�,��4�H�5��VM��\
我应该怎么做才能得到正确的数据BeautifulSoup?谢谢!
您是如何查看数据的?来自Eclipse的变量面板的 – 2011-03-24 08:29:51
。 – MangMang 2011-03-24 09:40:45