【发布时间】:2017-09-07 19:53:15
【问题描述】:
上下文
我对 Google Cloud Platform 还很陌生,我正在尝试 Google Dataflow。我读取了一个 CSV 文件并模拟了流数据。 CSV 行发布到主题 (PubSub) 中,Dataflow 读取它并将数据插入到 BigQuery 表中。
问题
当我的文件包含 STRING、FLOAT、INTEGER 类型时,我的流程已成功完成并且数据已加载到 BigQuery。但是,如果我将以下类型之一添加到我的流程中:DATETIME、TIME、DATE,它总是会失败。有很多代码示例,但我没有找到说明如何处理它的代码示例。
数据示例
2017-01-23 - 将其加载到 DATE 类型中
14:10:12 - 将其加载到 TIME 类型中
我希望你们能帮我解决这个问题......
【问题讨论】:
-
请提供有关您的代码的更多详细信息以及失败的完整打印输出。仅仅知道管道失败并不足以帮助您进行调试。
-
我们在 BQ 中使用时间戳作为日期格式。在从数据流向 BQ 添加数据时,我们将日期作为具有特定时间戳格式 yyyy-MM-dd hh:MM:ss.SSS 的字符串。这在我们构建的所有管道中都非常适合我们。希望这会有所帮助
-
那么,对于 Date 和 DateTime 格式,您找到要发送到 BigQuery 的 POJO 了吗?
标签: google-bigquery google-cloud-dataflow