【问题标题】:Download/read GovData with R使用 R 下载/读取 GovData
【发布时间】:2018-01-22 18:08:56
【问题描述】:

我偶然发现了以下网站,我想下载水道数字高程模型的数据。

https://www.govdata.de/web/guest/daten/-/details/1c669080-c804-11e4-8731-1681e6b88ec1bkg

现在,我有以下问题,我不明白如何下载数据。

任何人都知道我如何下载数据,例如通过使用编程语言 R 或 Python。

【问题讨论】:

标签: python r structure download


【解决方案1】:

您需要访问存储数据的网页,而不是包含数据链接的网页。根据数据的格式,您需要更改 (sep='\t') 以满足您的需要,

例如。一个 csv 将是 (sep=',')

然后您需要微调格式。

library(RCurl)

urlcontent<- 
getURL('https://www.govdata.de/web/guest/daten/-/details/1c669080-c804-11e4-
8731-1681e6b88ec1bkg')

DATA<- read.table(textConnection(urlcontent), header=T, sep = '\t')

请注意,read.table 函数可能仅适用于 tsv 类型的页面,您需要根据格式微调页面的读取。

编辑:

使用 URL 的链接地址我能够成功获取 URL,但问题是访问错误,我无权下载数据。这可能是代码中的另一个错误,或者是网站方面的实际凭据问题。

library(RCurl)

urlcontent<- 
getURL('https://www.govdata.de/ckan/api/rest/dataset/1c669080-c804-11e4-
8731-1681e6b88ec1bkg')

DATA<- read.table(textConnection(urlcontent), header=T, sep = '\t')

错误:您无权访问此服务器

【讨论】:

  • 但是,我仍然不明白如何获取存储数据的URL。他们提供了一个 API 和某种 CKAN 格式,据我了解,这应该允许您非常轻松地下载数据。我找到了一个名为 CKANR (github.com/ropensci/ckanr) 的包,但是,我不明白它是如何工作的。在网页 (govdata.de/web/guest/daten/-/details/…) 上,您可以找到 5 个使用 ATOM、XML、WMS 和 CKAN 完成的链接,我认为它们在某种程度上提供了以统一方式获取数据的方法。
  • @Mr.Man 太棒了,感谢您提供的信息。我今天会更深入地研究它
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2014-09-23
  • 2014-07-30
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多