【发布时间】:2019-02-18 09:11:10
【问题描述】:
作为 Apache Beam 编程模型的初学者,我想知道JDBC 和jdbcio 之间的区别。我开发了一个简单的数据流,其中涉及正常的JDBC 连接,它按预期工作。
是否必须使用jdbcio 而不是JDBC?如果是,我们在使用普通的JDBC 代码时会遇到哪些问题?
【问题讨论】:
-
什么是正常的 JDBC?
-
您是在使用 JDBC 连接读取 PCollection,还是在 DoFn 中使用它来丰富流经管道的元素?
-
@RezaRokni 我在 DoFn 中使用 jdbc。基本上我想了解使用 jdbcio 优于 jdbc 的优势。如果我在 DoFn 中使用普通的旧 jdbc 代码,我面临的挑战是什么?
-
@RuiWang,在这种情况下,我只是将纯 java jdbc 代码称为普通 jdbc。
-
在您的 DoFn 中,您是否在调用中使用数据元素的属性?例如,使用使用元素属性之一的谓词调用数据库。您还打算将其用于流式处理或批处理吗?
标签: jdbc google-cloud-dataflow apache-beam