【发布时间】:2016-04-04 10:52:48
【问题描述】:
我有一个愚蠢的问题涉及fold 并减少PySpark。我理解这两种方法之间的区别,但是,如果两者都需要应用的函数是可交换的幺半群,我无法找出fold cannot be substituted byreduce` 的示例。
另外,在fold的PySpark实现中使用acc = op(obj, acc),为什么使用这个操作顺序而不是acc = op(acc, obj)? (对我来说,第二个订单听起来更接近leftFold)
干杯
托马斯
【问题讨论】:
标签: apache-spark pyspark rdd reduce fold