2014-09-10 300 views
2

我想下载一个文件,该文件没有使用机械化的URL。我尝试.read(),但它给了我html文件,这是显而易见的。这是我需要发送到>文件> accessionlist并点击创建文件的网址http://www.ncbi.nlm.nih.gov/sra?term=SRP000714通过点击下载按钮使用Python下载文件

+0

它*确实*有一个网址。只是下载使用了一个发送POST数据的表单。找出它发送和复制的内容。 – simonzack 2014-09-10 23:35:15

+0

@simonzack你介意解释一下吗?我之前没有使用HTML源代码。 – abn 2014-09-10 23:37:59

回答

0

解决您的问题的一种非常非常非常懒惰的方式是使用网络抓取工具。 我不想考虑请求时使用的一种是splinter。 虽然它是为Web应用程序测试而开发的,但它足够适合做一些网页抓取。 看看Splinter文档,在那里一切都很好解释。

哦,它只适用于Python 2,它不是很酷。

(当然也有更好的答案)