【发布时间】:2017-05-20 06:25:31
【问题描述】:
我有一个如下所示的数据框:
ID NumRecords
123 2
456 1
789 3
我想创建一个新的数据框,它连接两列并根据 NumRecords 中的值复制行
所以输出应该是
ID_New 123-1
ID_New 123-2
ID_New 456-1
ID_New 789-1
ID_New 789-2
ID_New 789-3
我正在研究“爆炸”功能,但根据我看到的示例,它似乎只需要一个常数。
【问题讨论】:
标签: dataframe duplicates pyspark