【发布时间】:2021-04-21 17:39:20
【问题描述】:
我们如何才能以数据框中的多个列为中心。 例如这里提到的例子, https://spark.apache.org/docs/latest/sql-ref-syntax-qry-select-pivot.html
SELECT * FROM person
PIVOT (
SUM(age) AS a, AVG(class) AS c
FOR (name, age) IN (('John', 30) AS c1, ('Mike', 40) AS c2)
);
这里的 Pivot 是在 (name,age) 上完成的。 我们不能在 Spark scala 的 pivot 方法中传递多个参数,因为它只需要一个列名作为参数。 我们如何对数据框进行类似的操作?
【问题讨论】:
标签: java scala apache-spark apache-spark-sql pivot