使用 Mapreduce 进行递归计算答案

【问题标题】：Recursive calculations using Mapreduce使用 Mapreduce 进行递归计算
【发布时间】：2011-07-15 20:46:39
【问题描述】：

我正在研究 map reduce 程序，并正在考虑设计以下形式的计算，其中a1, b1 是与键关联的值

  a1/b1, a1+a2/b1+b2, a1+a2+a3/b1+b2+b3 ...

所以在 reducer 的每个阶段，我都需要之前的值。如何将其设计为 map reduce，因为在每个阶段只能读取与特定键关联的值。

如果你觉得这个问题不清楚，你能指导我回答这个一般性问题吗？

更一般的问题：如何在 map reduce 中使用递归开发斐波那契数列？

你能帮我修改一下设计吗

 key1, V1,V2,V3
 Key2, V4,V5,V6

映射器输出

  Key1_X V1
  Key1_Y V2
  Key2_X V4
  Key2_Y V5

减速机输出

  Key1_X {V1,.....}
  Key1_Y {V2,.....}

同样，现在处于下一个映射器阶段。我可以创建这样的列表吗：

   key1 {V1,....} {V2,....}
   Key2 {V4,....} {V5,....}

我这样做的原因是为了执行：

   Key1 {V1/V2, V1+V6/V2+V7, V1+V6+..../V2+V7+.. , .........}

可以这样做吗？因为数据集很大，所以我觉得还是用map reduce比较好。

改变设计是否有助于提高效率？

【问题讨论】：

【解决方案1】：

斐波那契的主要问题（正如您在具体问题中所指出的那样）是该系列中所有术语之间的依赖关系。如果不先计算前面的项，就无法计算后面的项。

MapReduce 非常好，如果你可以将你的工作分成独立的部分。

我没有看到一个简单的方法来做到这一点。

因此，任何“强制” MapReduce 解决此问题的构造都会破坏可扩展性优势。因此，使用您喜欢的编程语言进行简单的高度优化的循环将胜过任何 MapReduce 算法。

【讨论】：

对原始问题没有帮助，但it is possible to solve for the nth term of the Fibonacci sequence without recursion
酷！我不知道这个。不过，这个公式只适用于恰好需要斐波那契。
谢谢 Niels.. 感谢您的帮助
@NielsBasjes，对于任何 2 阶重复序列，有一种数学方法可以实现它。你得到相同类型的方程。

【解决方案2】：

编写你的映射器/归约器来计算这三件事：

the sum of a_i
the sum of b_i
their ratio

【讨论】：