【问题标题】:Do I really need Flink checkpointing?我真的需要 Flink 检查点吗?
【发布时间】:2020-02-05 07:30:33
【问题描述】:

我有一个 Flink 应用程序,它从 Kafka 读取一些事件,对来自 MySQL 的数据进行一些丰富,使用窗口函数缓冲数据并将窗口内的数据写入 HBase。我目前启用了检查点,但事实证明检查点非常昂贵,并且随着时间的推移,它需要的时间越来越长,并且会影响我的工作延迟(落后于 kafka 摄取率)。如果我想办法让我的 HBase 写入幂等,我是否有充分的理由使用检查点?我可以将内部 kafka 消费者客户端配置为每隔一段时间提交一次,对吗?

【问题讨论】:

    标签: apache-flink flink-streaming


    【解决方案1】:

    如果您要检查点的唯一内容是 Kafka 提供程序偏移量,那么检查点时间长到足以减慢您的工作流程,这会让我感到惊讶。或者状态是否也被保存在其他地方?如果是这样,您可以跳过它(只要根据您的说明,HBase 写入是幂等的)。

    请注意,您还可以调整检查点间隔,并且(如果需要)对 RocksDB 使用增量检查点。

    【讨论】:

    • 我调整了应用程序的检查点间隔。原来15秒太频繁了。我还调整了 setMinPauseBetweenCheckpoints 以确保应用程序正在取得进展。
    猜你喜欢
    • 2012-03-13
    • 2020-01-29
    • 2011-01-28
    • 1970-01-01
    • 2020-09-21
    • 1970-01-01
    • 2016-07-26
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多