【发布时间】:2020-02-05 07:30:33
【问题描述】:
我有一个 Flink 应用程序,它从 Kafka 读取一些事件,对来自 MySQL 的数据进行一些丰富,使用窗口函数缓冲数据并将窗口内的数据写入 HBase。我目前启用了检查点,但事实证明检查点非常昂贵,并且随着时间的推移,它需要的时间越来越长,并且会影响我的工作延迟(落后于 kafka 摄取率)。如果我想办法让我的 HBase 写入幂等,我是否有充分的理由使用检查点?我可以将内部 kafka 消费者客户端配置为每隔一段时间提交一次,对吗?
【问题讨论】:
标签: apache-flink flink-streaming