【发布时间】:2019-09-25 08:26:57
【问题描述】:
我正在尝试通过 pyspark 构建 sql 来实现这一点。 目标是将多行组合成单行 例子: 我要转换这个
+-----+----+----+-----+
| col1|col2|col3| col4|
+-----+----+----+-----+
|x | y | z |13::1|
|x | y | z |10::2|
+-----+----+----+-----+
到
+-----+----+----+-----------+
| col1|col2|col3| col4|
+-----+----+----+-----------+
|x | y | z |13::1;10::2|
+-----+----+----+-----------+
【问题讨论】:
-
使用
GROUP_CONCAT()和GROUP BY。
标签: sql pyspark apache-spark-sql pyspark-sql