【发布时间】:2015-06-19 16:49:39
【问题描述】:
我有 2 个配对的 RDD,我使用相同的键将它们连接在一起,现在我想使用其中一个值对结果进行排序。 新加入的RDD类型为:RDD[((String, Int), Iterable[((String, DateTime, Int,Int), (String, DateTime, String, String))])]
其中第一部分是配对的 RDD 键,可迭代部分是我加入的两个 RDD 中的值。我现在想按第二个 RDD 的时间字段对它们进行排序。我尝试使用 sortBy 函数,但出现错误。
有什么想法吗?
谢谢
【问题讨论】:
-
改进您的问题以获得快速而好的答案。
-
显示您的代码和错误。
标签: scala apache-spark rdd