【发布时间】:2015-06-05 00:55:18
【问题描述】:
在官方 Spark RDD API 中:
https://spark.apache.org/docs/2.1.0/api/java/org/apache/spark/rdd/AsyncRDDActions.html
count、collect、foreach 和 take 都有返回 Future 的异步变体。
为什么 fold、reduce 和 aggregate 没有这个 async/future 接口?这似乎很重要。
【问题讨论】:
-
和 saveAsObjectFile
-
同意。这是 Spark API 中令人不安的不一致。如果有的话,为
fold提供异步选项会更有意义,因为它更通用,您可以使用它来创建异步reduce或count。
标签: asynchronous apache-spark future