【发布时间】:2019-10-21 10:22:04
【问题描述】:
我将我的谷歌驱动器安装在我的 colab 笔记本中,并且我有一个相当大的熊猫数据框并尝试 mydf.to_feather(path) 路径在我的谷歌驱动器中。预计它有 100 兆大,而且需要很长时间。
这是意料之中的吗?似乎 colab 和 google drive 之间的网络链接不是很好。有人知道服务器是否在同一地区/地区吗?
我可能需要更改我的工作流程以避免这种情况。如果您有任何最佳实践或建议,请告诉我,如果没有使用所有 GCP(我希望没有这种延迟)。
【问题讨论】:
-
这似乎很零星。我保存了另一个更大的数据框 to_feather(...),这一次它要快得多。
-
不看你的代码,这是任何人的猜测......
-
我在做绝对“默认”的事情。如果您已经看到 .to_feather(...) 发生这种情况,您可能不需要查看我的代码即可重现。我在下面发布了一个解决方法,并猜测发生了什么。
标签: pandas google-drive-api google-colaboratory feather