【发布时间】:2014-07-13 08:48:59
【问题描述】:
阅读 Spark 方法 sortByKey :
sortByKey([ascending], [numTasks]) When called on a dataset of (K, V) pairs where K implements Ordered, returns a dataset of (K, V) pairs sorted by keys in ascending or descending order, as specified in the boolean ascending argument.
是否可以只返回“N”个结果。所以不是返回所有结果,而是返回前 10 个。我可以将排序后的集合转换为数组并使用 take 方法,但由于这是一个 O(N) 操作,有没有更有效的方法?
【问题讨论】:
-
所以你知道怎么排序了,你问的是怎么取前N个。我可以建议编辑问题摘要吗?
标签: scala apache-spark rdd