【问题标题】:storm + kafka: understanding ack, fail and latencystorm + kafka:理解ack、fail和latency
【发布时间】:2015-06-14 20:02:44
【问题描述】:

我正在使用KafkaSpout 从 2 个 Kafka 主题中消费,每个主题有 6 个分区。 spout 转到单个bolt 以解包相关字节,然后转到第二个bolt 进行进一步处理。

当我查看 storm-ui 时,这些数字并没有多大意义,我希望有人能解释一下。

  1. Kafka spout 说它“确认”了约 3600 个元组,但失败了约 73M。查看下一组中的螺栓,我发现有些人确认了 ~73M,0 失败,而其他人确认了 ~1.3M(没有失败)。这些数字不应该以某种方式排列吗?

  2. spout 行中的“完整延迟”约为 2500 毫秒,而螺栓的执行和处理延迟范围为

是的 - 此拓扑存在一些重大问题(请参阅this 相关问题)。

我附上 UI 的图像,希望有人能帮助我理解它。

【问题讨论】:

    标签: java apache-storm


    【解决方案1】:

    听起来您的元组正在超时并且正在通知 spout。螺栓报告的零失败意味着螺栓没有明确地失败任何元组,这就是为什么我认为它们一定已经超时了。

    根据您的其他问题,因为只有一些螺栓完成所有工作,所以您会收到严重的积压,这可能是元组超时的原因。

    根据您其他问题中的评论,您可以更改为随机分组以将工作负载分散到所有螺栓,并且您可能会增加配置中的超时设置。

    【讨论】:

      猜你喜欢
      • 2015-05-06
      • 2019-02-08
      • 1970-01-01
      • 2015-09-11
      • 2023-04-05
      • 1970-01-01
      • 2016-11-23
      • 2018-09-19
      • 2019-08-16
      相关资源
      最近更新 更多