【发布时间】:2019-03-28 07:11:03
【问题描述】:
我遇到了一个帖子Scaling Klaviyo’s Event processing Pipeline with Stream Processing,在帖子中,名为 Klaviyo 的公司的人在不同的时间范围内进行计数,每小时、每天甚至每月。
我有几个问题,如果我理解正确的话,他们正在使用timewindow,但是像一天这样长时间使用timewindow是否正常?!
这对我来说没有意义,如果您要进行每日或每月计数,为什么不使用批处理?在这种情况下使用流媒体的根本好处是什么?
另一种情况,如果我需要从一开始就实时统计kafka事件,现实世界的解决方案是什么?每次事件到达时使用 flink 流来更新 redis 中的“计数器”?如果kafka很忙,比如每秒几百万条消息,会不会有太多的IO和网络?
【问题讨论】:
标签: apache-flink flink-streaming