【发布时间】:2021-11-28 06:22:34
【问题描述】:
我在使用 Mongodb 和 Spark 时遇到了聚合问题。我不是这方面的专家,我什至不知道是否存在我需要的操作。
我有几条记录,已经按用户名汇总。然后是这个特殊的用户名,叫做“-”。
username1 data1:100
username2 data1:100
username3 data1:100
username4 data1:100
- data1:55
现在,我需要将用户名 "-" 中的 data1 sum 到所有其他 data1。
username1 data1:155
username2 data1:155
username3 data1:155
username4 data1:155
- data1:55
如何使用 mongodb spark 制作这个?
其实我有
rawDataRows.///some stuff//.groupBy("username")
这会产生我写的输出,有人可以帮我将用户名“-”中的数据“合并”到所有其他用户吗?
【问题讨论】:
-
只出现 o4 多次?
-
那个叫“-”的“特殊用户”?只有一个。
-
真的没那么难
-
我是 spark mongo 的新手,你能给我一些建议吗?
-
给你一些建议...
标签: database mongodb apache-spark