【问题标题】:R download and unzip file to store in data frameR下载并解压缩文件以存储在数据框中
【发布时间】:2015-12-15 08:28:01
【问题描述】:

我有一个与here 中发布的问题类似的问题,但建议的解决方案对我不起作用。

我想简单地从 github 下载一个压缩文件,解压缩并将数据存储在数据框中(这是一个 Coursera 项目,但主要目的是创建一个 Markdown 文档而不是下载/解压缩文件.. .so 我不是在问如何做作业)。

我的代码如下:

activity_url <- "https://github.com/rdpeng/RepData_PeerAssessment1/blob/master/activity.zip"
temp <- tempfile()
download.file(activity_url, temp, method = "libcurl", mode = "wb")
unzip(temp, "activity.csv")
mydata <- read.table("activity.csv", header = "TRUE", sep = ",")
unlink(temp)

我相信错误发生在解压缩文件的那一刻。我得到的错误如下:

Error in file(file, "rt") : impossible d'ouvrir la connexion
Calls: <Anonymous> ... withCallingHandlers -> withVisible -> eval -> eval -> read.table -> file
Exécution arrêtée

有没有人提示错误在哪里?

【问题讨论】:

    标签: r download dataframe unzip


    【解决方案1】:

    问题不在于您的代码,而在于 GitHub:它不支持直接下载部分存储库,即使使用“原始”访问 URL 来访问二进制文件也是如此。您的代码会下载一个文件,但它不会解压缩。更详细的解释见Download single files from GitHub

    所以例如这是可行的:

    activity_url <- "http://kenbenoit.net/files/activity.zip"
    temp <- tempfile()
    download.file(activity_url, temp)
    unzip(temp, "activity.csv")
    # note that here I modified your original read.table() which did not work
    mydata <- read.csv("activity.csv")
    unlink(temp)
    

    【讨论】:

    • 好的,谢谢。我花了几个小时试图找到错误,现在我知道它只是 GitHub
    猜你喜欢
    • 2013-02-27
    • 1970-01-01
    • 2011-11-15
    • 1970-01-01
    • 1970-01-01
    • 2020-03-12
    • 1970-01-01
    • 2021-10-02
    • 1970-01-01
    相关资源
    最近更新 更多