【发布时间】:2021-11-14 15:36:59
【问题描述】:
我在 Scala 中有一个案例类 RDD,需要按每个组(患者 ID)查找最早的日期。
这是输入:
patientID date
000000047-01 2008-03-21T21:00:00Z
000000047-01 2007-10-24T19:45:00Z
000000485-01 2011-06-17T21:00:00Z
000000485-01 2006-02-22T18:45:00Z
预期应该是:
patientID date
000000047-01 2007-10-24T19:45:00Z
000000485-01 2006-02-22T18:45:00Z
我尝试了类似以下的方法,但没有成功
val out = medication.groupBy(x => x.patientID).sortBy(x => x.date).take(1)
【问题讨论】:
-
定义“不起作用”:您遇到什么错误?你有什么不明白的?
-
提示:
groupBy的返回类型是什么?