【发布时间】:2015-04-12 11:14:37
【问题描述】:
对于storm-starter 中的简单字数统计程序,逻辑相当简单:
1) 把句子分成单词
2) 发出每个单词
3)聚合计数(将计数存储在地图中)
但是,这里有两个问题:
1)程序使用12个单独的线程来执行聚合部分,也就是说计数不是GLOBAL,我们要多加一层才能得到全局计数?
2)在bolt中,maps是用来存储count的,也就是说它有状态,如果当前worker失败了,bolt中存储的count都没有了怎么办?因为storm是无国籍的
3) 我们应该使用 Trident 来代替吗?
【问题讨论】:
标签: apache-storm word-count trident