【发布时间】:2016-12-05 17:05:10
【问题描述】:
我有一个 RDD(会话 ID、会话开始时间、会话长度)。我需要通过会话 ID 减少此 RDD,然后生成相应会话开始时间和长度的数组。有人能指点我如何在 scala 中编写代码吗?
所以我需要从 RDD[(session ID , session start-time, session length)] 转换 到 RDD[(session ID , Seq[(session start-time, session length)]) 我该怎么做?
【问题讨论】:
标签: scala apache-spark reduce