读取托管在 Google Drive 上的 csv 文件答案

【问题标题】：Read csv file hosted on Google Drive读取托管在 Google Drive 上的 csv 文件
【发布时间】：2016-01-13 02:46:54
【问题描述】：

我正在尝试访问（读入 R）托管在 Google 云端硬盘（不是云端硬盘电子表格）上的 .csv 文件——已将文件权限设置为“可公开共享”。

所以基于可分享的网址：

sURL <-"https://drive.google.com/file....view?pli=1"

我一直在尝试阅读：

library(curl)
x <- curl(sURL)
data <- read.csv(x)

我收到此错误消息：

Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
more columns than column names

知道投诉是关于什么的吗？谢谢大家。

【问题讨论】：

您可以向我们展示文件的前几行吗？
@Richard：上传到云端硬盘的原始文件的列名称为var1、var2、var3、...等。够了吗？
投诉说，列名比列字段多。就像在read.csv(text = "col1,col2\n1,2,2,2") 中一样，其中1 是第1 行的行名，3 个2s 是字段值；但只定义了两个列标题。尔格：错误..
@lukeA：本地 .csv 是正确的（列/值都按顺序排列）。仅当从网络（Google Drive）读取相同的 .csv 文档时才会出现错误消息。
@lukeA：非常感谢。这就是所需要的：从 URL 中解析 id，然后将其粘贴到带有 ..&export=download 的地址。所以不需要curl。 Guess 将不得不使用正则表达式来自动化该过程。

标签： r csv curl web

【解决方案1】：

你可以这样试试

id <- "0B-wuZ2XMFIBUd09Ob0pKVkRzQTA" # google file ID
read.csv(sprintf("https://docs.google.com/uc?id=%s&export=download", id))

【讨论】：

@lukeA：再次感谢。如果知道为什么curl 不起作用，请分享。
curl 像这样工作：library(curl); id <- "0B-wuZ2XMFIBUd09Ob0pKVkRzQTA"; sURL <- sprintf("https://docs.google.com/uc?id=%s&export=download", id); con <- curl(sURL); read.csv(con)。它返回一个连接，而不是一个文本文件。
@lukeA: 再次感谢:-)。这解决了一些问题。