【发布时间】:2013-03-11 14:58:44
【问题描述】:
我正在尝试使用 azure 服务总线来解决一个令人尴尬的并行问题 - 一个可以分成 N 个独立部分的问题。这本质上是一个 map/reduce 问题,但我不想使用 Hadoop,因为我需要实时答案(
我最初的计划是有一群工人,每个工人都有 1/N 片数据库。然后,我在公共汽车上放了 N 个搜索问题,每个工人都会做自己的事情。聚合器将合并结果。
我在这里叫错树了吗?这是解决此类问题的错误方法吗?
【问题讨论】:
-
您打算如何同步 N 个工作人员以便聚合器知道何时启动?另外,什么是令人尴尬的并行问题?
-
令人尴尬的并行意味着并行化“太容易”:en.wikipedia.org/wiki/Embarrassingly_parallel 我正计划让聚合器只关注所有工作人员都停止工作的时间。
标签: azure parallel-processing azureservicebus