【发布时间】:2018-11-21 16:51:13
【问题描述】:
我需要实现以下数据流。我有一个有 9 个分区的 kafka 主题。我可以用 9 个并行级别阅读这个主题。我也有 3 个节点的 Flink 集群。该集群的每个节点都有 24 个任务槽。
首先,我想像下面那样传播我的 kafka,每台服务器都有 3 个分区。顺序无关紧要,我只是将 kafka 消息转换并发送到 DB。
第二件事是,我想在节省 NoSQL DB 的同时提高并行度。如果我提高并行度 48,由于发送 DB 是 IO 操作,它不会消耗 CPU,我想确定,当 Flink 重新平衡我的消息时,我的消息将留在同一服务器。
对我有什么建议吗?
【问题讨论】: