【问题标题】:How can I load data from BigQuery to Spanner?如何将数据从 BigQuery 加载到 Spanner?
【发布时间】:2018-09-02 04:58:44
【问题描述】:

我想运行一项基于 BigQuery 设置进行一些聚合的日常工作。输出是我写回 BigQuery 的单个表,大约 80GB 超过 900M 行。我想让这个数据集可用于在线查询使用模式,而不是用于分析。

查询数据将始终在应该易于按主键或辅助键分段的特定切片上完成。我认为 Spanner 在查询性能和分片方面可能是一个不错的选择,但我无法确定如何定期将大量数据加载到其中,以及如何处理上传之间的“切换”,因为它不支持表重命名。

有没有办法以编程方式执行这种批量加载?我们已经在内部使用 Apache Airflow 进行类似的数据处理和传输任务,所以如果可以在那里处理它会更好。

【问题讨论】:

    标签: google-bigquery airflow google-cloud-spanner


    【解决方案1】:

    您可以使用 Cloud Dataflow。

    在您的管道中,您可以从BigQuery 读取并写入Cloud Spanner

    【讨论】:

    • 谢谢,但这似乎有点过多的基础设施。我希望从 S3 功能中获得类似于 AWS Aurora 的负载。
    猜你喜欢
    • 1970-01-01
    • 2018-07-02
    • 1970-01-01
    • 2016-06-07
    • 2023-03-26
    • 2016-12-26
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多