【发布时间】:2019-09-06 18:01:05
【问题描述】:
我需要根据 python/pyspark 中的另一列值将一列拆分为 4。 我尝试根据代码过滤它并加入多个df。 有更好的方法吗?
Code score ID
AAA 12 ABCD
BBB 14 ABCD
CCC 16 ABCD
DDD 67 ABCD
AAA 89 XYZ
BBB 65 XYZ
CCC 19 XYZ
DDD 56 XYZ
ID score_AAA score_BBB score_CCC score_DDD
ABCD 12 14 16 67
XYZ 89 65 19 56
【问题讨论】:
-
如果您不发布您的“当前”方式,有人怎么能提出“更好”的方式?你能展示一下你试过的代码吗?
-
您想要 pandas 答案还是 sparksql 答案?请查看How to Ask
标签: pandas pyspark pyspark-sql pyspark-dataframes