【发布时间】:2021-02-09 07:47:30
【问题描述】:
我想创建连接器(类似于 Kafka-Connect 中的 Debezium)以在 BigQuery 表中反映 MySQL 源数据库的每一次更改。
有一个问题 - 源数据库每 10 分钟删除一次并重新创建 - 有些行是相同的,有些是更新的,有些是全新的。所以我不能通过 Debezium 做到这一点,因为每 10 分钟我就会有 Kafka 中的所有记录。
我只想迁移到 BQ 表中的新值或更新值。 “复制”整个源数据库但删除重复记录的机制(这并不完全相同,因为这将是一个新数据库)。因此,例如从每条记录创建哈希并检查 - 哈希是否已经在 BQ 中 - 通过,如果没有添加它。
我觉得应该是这样的:
但是如何以 MySQL 作为源来创建整个管道。
【问题讨论】:
标签: mysql google-bigquery