【问题标题】:Read csv file hosted on Google Drive读取托管在 Google Drive 上的 csv 文件
【发布时间】:2016-01-13 02:46:54
【问题描述】:

我正在尝试访问(读入 R)托管在 Google 云端硬盘(不是云端硬盘电子表格)上的 .csv 文件——已将文件权限设置为“可公开共享”。

所以基于可分享的网址:

sURL <-"https://drive.google.com/file....view?pli=1"

我一直在尝试阅读:

library(curl)
x <- curl(sURL)
data <- read.csv(x)

我收到此错误消息:

Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
more columns than column names

知道投诉是关于什么的吗?谢谢大家。

【问题讨论】:

  • 您可以向我们展示文件的前几行吗?
  • @Richard:上传到云端硬盘的原始文件的列名称为var1var2var3、...等。够了吗?
  • 投诉说,列名比列字段多。就像在read.csv(text = "col1,col2\n1,2,2,2") 中一样,其中1 是第1 行的行名,3 个2s 是字段值;但只定义了两个列标题。尔格:错误..
  • @lukeA:本地 .csv 是正确的(列/值都按顺序排列)。仅当从网络(Google Drive)读取相同的 .csv 文档时才会出现错误消息。
  • @lukeA:非常感谢。这就是所需要的:从 URL 中解析 id,然后将其粘贴到带有 ..&amp;export=download 的地址。所以不需要curl。 Guess 将不得不使用正则表达式来自动化该过程。

标签: r csv curl web


【解决方案1】:

你可以这样试试

id <- "0B-wuZ2XMFIBUd09Ob0pKVkRzQTA" # google file ID
read.csv(sprintf("https://docs.google.com/uc?id=%s&export=download", id))

【讨论】:

  • @lukeA:再次感谢。如果知道为什么curl 不起作用,请分享。
  • curl 像这样工作:library(curl); id &lt;- "0B-wuZ2XMFIBUd09Ob0pKVkRzQTA"; sURL &lt;- sprintf("https://docs.google.com/uc?id=%s&amp;export=download", id); con &lt;- curl(sURL); read.csv(con)。它返回一个连接,而不是一个文本文件。
  • @lukeA: 再次感谢:-)。这解决了一些问题。
猜你喜欢
  • 2018-08-18
  • 2019-10-29
  • 2021-02-14
  • 2023-04-05
  • 2016-01-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多