【问题标题】:Import `.csv` files from Google drive into Jupyter notebook将“.csv”文件从 Google 驱动器导入 Jupyter 笔记本
【发布时间】:2023-03-26 00:47:01
【问题描述】:

我正在做一些关于 Covid-19 的工作,我必须访问 Github 上的 .csv 文件。 (老实说,网址是https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_time_series)。

所以,我去了这个页面,直接在我的硬盘上下载了我感兴趣的.csv文件:C: \ Users \ ... .csv 然后,我将这些文件作为 pandas 数据框导入到 Jupyter 笔记本 中以使用 Python,例如编码:dataD = pd.read_csv ('C: / Users / path_of_my_file_on_my_computer ...')

一切都很好。

为了更容易与其他人聊天,有人告诉我,我应该导入 .csv 文件,而不是在我的 C 上,而是在 Google 驱动器 (https://drive.google.com/drive/my-drive) 上,然后将 .ipynb 也放在那里我在 Jupyter notebook 中创建的文件,然后允许相关人员访问。

所以我在我的驱动器上创建了一个文件夹(例如,Covid-19)将这些 .csv 文件放在那里,但我不明白我应该编写什么样的 Python 代码在我的 Python 文件的开头替换简单的先前指令dataD = pd .read_csv ('C: / Users / path_of_my_file_on_my_computer ...'),以便程序直接从我的 Google 驱动器中读取数据,而不再从我的C 中读取数据?

我看过各种帖子,似乎或多或少地谈到了这个问题,但我真的不明白该怎么做。

我希望我的问题足够清楚(我在我的谷歌驱动器中附上了一张情况图片,假设它提供了有趣的信息......它是法语的)

【问题讨论】:

  • 而不是调用某人的谷歌驱动表寻找 api。尝试找到该数据的 api,然后您就可以访问它。
  • 如果文件在 github 上,为什么不直接从那里导入呢?所有 csv 文件都有一个 URL,您可以将其读入 pandas。

标签: python-3.x jupyter-notebook google-drive-api


【解决方案1】:

鉴于您的文件已经托管在云中并且您正在计划一个协作方案,我认为@Eric 提出的想法实际上更聪明。

方法一:

否则,如果您不能依赖该数据源,则必须为您的脚本构建授权流程以访问 Google 云端硬盘资源。您可以查看here 的完整文档,了解如何构建 Python 脚本并与 Google Drive API 交互。

方法二:

虽然 Google Drive API 需要授权才能访问文件 URL,但您可以构建一个解决方法。 Google 云端硬盘会生成一些导出链接,如果您的文件是公开的,则无需授权即可访问这些链接。在this Stack Overflow answer你可以找到更多的细节。

在您的 Python 脚本中,您将能够直接解析 URL 请求,而无需访问文件系统或谷歌驱动器授权流程。

【讨论】:

  • 我遗漏了一些东西......按照@Eric提出的想法,我使用了代码data = pd.read_csv('https://github.com/CSSEGISandData/... ... ... /time_series_covid19_deaths_global.csv', sep=',', header=0),其中包含csv文件的整个URL,但我得到了ParserError我不明白...
  • 暂时不是@Alessandro。我真的是一个初学者,不幸的是,所提供的信息对我来说太技术性了;我真的很难理解所说的内容和具体要做的事情;例如,虽然我有一个 Google Drive 帐户,但我不知道 Google Drive API 是什么……我想一旦我们学会它,它就很简单,但是,正如我所说,我真的开始了。目前,我只是将 .csv 文件保存在我的硬盘上,我将逐步了解更多信息。无论如何感谢您的解释;它们肯定对我有用。
  • 您好@Andrew,我看到您正在访问 github 页面而不是原始 .csv 文件。因此,使用带有 html 文件的 parse_csv 函数的解析错误。尝试使用 raw.githubusercontent.com 域访问 github 资源。例如在您的情况下:https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv。这会导致任何方法出现问题,所以让我知道这是否适合你。
  • 嗨@Alessandro,我测试了你的方法,效果很好!我得到了一个出色的数据框。我完全不知道这个raw.githubusercontent.com 域。我非常感谢你花时间解决这个问题,这仍然困扰着我很多。非常感谢!
猜你喜欢
  • 1970-01-01
  • 2018-03-13
  • 2021-09-29
  • 1970-01-01
  • 1970-01-01
  • 2019-12-28
  • 2020-11-15
  • 2020-11-20
  • 2017-12-04
相关资源
最近更新 更多