【发布时间】:2017-03-31 09:23:58
【问题描述】:
我有以下数据框:
January | February | March
-----------------------------
10 | 10 | 10
20 | 20 | 20
50 | 50 | 50
我正在尝试向其中添加一列,它是每行值的总和。
January | February | March | TOTAL
----------------------------------
10 | 10 | 10 | 30
20 | 20 | 20 | 60
50 | 50 | 50 | 150
据我所知,所有内置的聚合函数似乎都是用于计算单列中的值。如何在每行的基础上跨列使用值(使用 Scala)?
我已经做到了
val newDf: DataFrame = df.select(colsToSum.map(col):_*).foreach ...
【问题讨论】:
-
什么是 colsToSum?也许 List[Column] ?
标签: scala apache-spark