【发布时间】:2017-05-29 01:54:14
【问题描述】:
1,根据下面的描述,Storm 和 Spark Streaming 都处理批量或小/微批量的消息/元组? https://storm.apache.org/releases/2.0.0-SNAPSHOT/Trident-tutorial.html
2,如果上述问题的答案是肯定的,这意味着两种技术在处理消息/元组时都有延迟?如果是这种情况,为什么我经常听说 Storm 的延迟比 Spark Streaming 更好,例如下面的文章? https://www.ericsson.com/research-blog/data-knowledge/apache-storm-vs-spark-streaming/
3,从 Trident-tutorial 中描述: “通常,这些小批量的大小将在数千或数百万个元组的数量级上,具体取决于您的传入吞吐量。” 那么小批量的真正大小是多少?数千或数百万个元组?如果是,Storm 如何保持短延迟?
https://storm.apache.org/releases/2.0.0-SNAPSHOT/Trident-tutorial.html
【问题讨论】: