2017-08-14 70 views
0

我偶然发现了下面的网站,我想下载水道数字高程模型的数据。使用R下载/阅读GovData

https://www.govdata.de/web/guest/daten/-/details/1c669080-c804-11e4-8731-1681e6b88ec1bkg

现在,我有以下问题,我不明白我怎么能下载数据。任何人都知道我可以如何下载数据,例如,如何使用这些数据。通过使用编程语言R或Python。

+1

考虑搞清楚如何使用Python下载文件:https://stackoverflow.com/questions/11768214/python-download-a -file-over-an-ftp-server或者https://stackoverflow.com/questions/22676/how-do-i-download-a-file-over-http-using-python –

回答

0

你将需要在数据存储的网页,而不是与数据链接的网页。根据数据的格式,您需要更改(sep ='\ t')以适合您的需求,例如:

ex。一个csv会是(sep =',')

然后你需要微调格式。

library(RCurl) 

urlcontent<- 
getURL('https://www.govdata.de/web/guest/daten/-/details/1c669080-c804-11e4- 
8731-1681e6b88ec1bkg') 

DATA<- read.table(textConnection(urlcontent), header=T, sep = '\t') 

请注意read.table函数只能用于tsv类型的页面,您将需要根据格式精细调整页面的阅读。

编辑:

使用的链接地址我是能够成功地抓住网址URL,这个问题虽然是一个访问错误,我没有访问下载数据。这可能是代码中的另一个错误,或者是网站端的实际证书问题。

library(RCurl) 

urlcontent<- 
getURL('https://www.govdata.de/ckan/api/rest/dataset/1c669080-c804-11e4- 
8731-1681e6b88ec1bkg') 

DATA<- read.table(textConnection(urlcontent), header=T, sep = '\t') 

错误:您没有权限访问此服务器

+0

谢谢你的回复。 –

+0

但是,我仍然不明白如何获取存储数据的URL。他们提供一个API和一些CKAN格式,据我所知,这应该允许你很容易地下载数据。我发现一个名为CKANR的包(https://github.com/ropensci/ckanr),但是,我不明白这是如何工作的。在网页上(https://www.govdata.de/web/guest/daten/-/details/1c669080-c804-11e4-8731-1681e6b88ec1bkg),您可以找到5个由ATOM,XML,WMS和CKAN完成的链接,我以某种方式想到了那些提供统一方式获取数据的方法。 –

+0

@ Mr.Man真棒,感谢您的信息。今天我会更多地研究它 – Chabo