【发布时间】:2019-05-03 07:55:15
【问题描述】:
我有以下 spark DataFrame:
+---+---+
| a| b|
+---+---+
| 1| 1|
| 1| 2|
| 1| 3|
| 1| 4|
+---+---+
我想创建另一个名为"c" 的列,其中包含“b”对“a”的累积乘积。生成的 DataFrame 应如下所示:
+---+---+---+
| a| b| c|
+---+---+---+
| 1| 1| 1|
| 1| 2| 2|
| 1| 3| 6|
| 1| 4| 24|
+---+---+---+
如何做到这一点?
【问题讨论】:
-
嗨,欢迎来到 Stackoverflow!如果您在提出新问题之前可以read these guidelines,那就太好了。谢谢。
标签: apache-spark pyspark apache-spark-sql