【发布时间】:2021-06-15 16:44:12
【问题描述】:
我查看了this SO post,但它已经使用了三年,我认为 GCP 从那时起发生了变化。
我要做的是使用 DataFlow 作业设置数据管道,将数据从一个 GBQ 项目复制/转换到另一个 GBQ 项目。
要创建 DataFlow 作业,您需要选择一个模板,并且没有符合我需要的模板,即没有 BQ 到 BQ 模板。
有一个使用自定义模板的选项(我想这将是一个 python 脚本或类似的东西),但没有 BQ 到 BQ 模板似乎很奇怪。 DataFlow 不是适合这项工作的工具吗?我应该只使用预定查询吗?
提前致谢
【问题讨论】:
-
这些是什么类型的转换?它们不能使用查询来完成吗,BQ 有很多预定义的函数并创建用户定义的函数
-
@vinayhudli 没什么太疯狂的。基本上旋转一个表并进行一些聚合。我认为预定查询可能是正确的方法。谢谢!
-
澄清一下,您不一定需要使用模板来使用数据流。您也可以编写一个新的 Beam 管道并使用 Dataflow 执行它。根据您的描述,听起来这将是一个类似于此示例的非常简单的管道 - github.com/apache/beam/blob/master/examples/java/src/main/java/…
标签: google-bigquery google-cloud-dataflow