【问题标题】:How to transcribe data from bigquery to bigquery with dataflowsdk?如何使用 dataflowsdk 将数据从 bigquery 转录到 bigquery?
【发布时间】:2016-07-05 19:30:05
【问题描述】:

在构建源为 BigQueryIO.Read 的管道时,您会得到一组 TableRow 对象以供使用。

我本质上是想对这些 TableRow 对象进行一些小改动,然后使用 BigQueryIO.Write 将对象输出到新表中。

但是,我遇到了 TableRow 实际上与原始表结构不匹配的问题,即。它有带有“_”而不是“.”的键,而且是完全平坦的。 (因此与原始架构不匹配)。

我是否缺少使 TableRow 行为正确的步骤?
这似乎是一个相当简单的工作流程,所以当我遇到这个问题时,我有点惊讶。

目标: BigQueryIO.Read -> TableRow -> BigQueryIO.Write

【问题讨论】:

    标签: google-bigquery google-cloud-dataflow


    【解决方案1】:

    您可以通过指定.withoutResultFlattening() 来避免TableRow 的扁平化

    顺便说一句,扁平化和选择下划线作为分隔符均由 BigQuery 完成,并由查询选项控制。

    【讨论】:

    • 酷,我来看看行为是什么样的。 :)
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2016-06-07
    • 1970-01-01
    • 2018-09-02
    • 2018-03-30
    • 2020-11-25
    • 1970-01-01
    • 2023-03-21
    相关资源
    最近更新 更多