【发布时间】:2017-09-05 18:50:07
【问题描述】:
我在 BigQuery 表中有一个大数据集(约 4500 万行,13Gb 的数据)。我想在我的 Google Datalab Notebook 中处理这些数据,以使用 pandas 进行一些基本统计,以便稍后在 Datalab 单元格中使用 matplotlib 可视化数据。我认为尝试将所有数据集加载到 pandas 的 Dataframe 中并不是一个好主意(至少我会遇到 RAM 问题)。
是否可以从 BigQuery 批量读取数据(比如 10K 行)以在 Datalab 中使用?
提前致谢!
【问题讨论】:
标签: pandas google-bigquery google-cloud-datalab