我试图抓取一个网址,其中的URL被重定向,但是通过编程方式尝试这样会给我一个403错误代码(Forbidden)。我可以将网址在浏览器和浏览器会遵循正确的URL,但...Python HTTP重定向请求被禁止
显示一个简单的例子,我试图去: http://en.wikipedia.org/w/index.php?title=Mike_tyson
我试过的urllib2和机械化但是两者都不起作用。我对网络编程相当陌生,想知道是否还有其他一些技巧需要我遵循重定向!
谢谢!
编辑
好了,所以这是真的搞砸。我最初正在研究替代方法,因为我试图刮取一个Mp3。我正在设法成功下载mp3,但它全部被破坏。
原来,这与我在Windows或我目前的Python版本中下载它有某种关系。 我测试了我的Ubuntu发行版上的代码,并且下载的mp3文件完全没问题....
所以我只用了简单的urllib2.openurl,它工作的很完美!
我想知道为什么在Windows上下载会损坏mp3?
“我想知道为什么在Windows上下载会损坏mp3?”呃,因为它是真正的操作系统的玩具般的借口? – aaronasterling 2010-10-07 05:11:08
或者我忘了打开二进制模式:) – Setheron 2010-10-07 17:31:45