2012-11-21 59 views
1

我使用python打开与下面的代码的URL,有时我得到这个错误:的urlopen(URL)403 Forbidden错误

从urllib的进口的urlopen URL =“HTTP://www.gutenberg。组织/文件/ 2554/2554.txt” 原料=的urlopen(URL).read()

错误: '\ n \ N403紫禁城\ n \ n

故宫

\ n

你不\' 吨有权限访问/files/2554/2554.txt\non此服务器。

\ n
\ nApache服务器在www.gutenberg.org端口80 \ n \ n”

这是什么?

谢谢

回答

2

这是网页封锁Python的访问,因为它正在与标题“的User-Agent的要求。

要解决这个问题,请下载“的urllib2”模块,并使用此代码:

req = urllib2.Request(url, headers ={'User-Agent':'Chrome'}) 
raw = urllib2.urlopen(req).read() 

你是知道与头“Chrome”和访问该网站不再被禁止(我尝试过自己和它的工作)。

希望这会有所帮助。