【发布时间】:2017-12-17 02:17:48
【问题描述】:
目前,我们正在将从供应商 API 检索到的数据上传到 Google 数据存储区。想知道数据存储和查询数据的最佳方法是什么。
我将需要查询数百万行数据,并从数据中提取定制工程特征。所以想知道我是否应该将数据直接加载到 BigQuery 并查询它以加快处理速度,还是将其存储在 Datastore 中然后将其移动到 BigQuery 进行查询?我将使用 pandas 对存储的数据进行统计。
【问题讨论】:
标签: python pandas google-cloud-datastore google-bigquery google-cloud-platform