【发布时间】:2017-12-18 16:30:53
【问题描述】:
spark 和 scala 的新手。试图在下面实现。我的消息如下所示(键、ID、版本、数据对象)
val transformedRDD = processedMessages.flatMap(message => {
message.isProcessed match {
case true => Some(message.key, message.id, message.version, message)
case false => None
}
}).groupByKey
我想在每条消息上按 ID 分组并获取最新版本的消息,然后 groupbykey,然后调用如下所示的预定义方法
Ingest(key,RDD[dataObject])
【问题讨论】:
-
这并不能回答您的问题,但可能会帮助您选择适合您需要的模块。如果您“刚接触 spark 和 scala”,为什么要使用 Spark Streaming。?!
-
我在问题本身中没有看到任何 Spark Stream 引用。
标签: scala apache-spark spark-streaming