【发布时间】:2020-02-18 04:46:45
【问题描述】:
我有一个如下的数据框:
group value
B 2
B 3
A 5
A 6
现在我需要根据组减去行。即 2-3 和 5-6。改造后应该是这个样子。
group value
B -1
A -1
我尝试了下面的代码,但无法解决我的问题。
val df2 = df1.groupBy("Group").agg(first("Value")-second(col("Value")))
【问题讨论】:
-
你怎么知道什么是第一价值?如果有超过 2 个值怎么办?
-
使用 spark,永远记住只使用关联函数。在上述情况下,(5-6) 与 (6-5) 不同。
-
我们之前执行了一些转换,所以我们将知道我们的第一个值是什么
标签: scala apache-spark apache-spark-sql