【发布时间】:2026-01-31 04:30:01
【问题描述】:
我有一个类似于下面的 PySpark 数据框:
order_id item qty
123 abc 1
123 abc1 4
234 abc2 5
234 abc3 2
234 abc4 7
123 abc5 5
456 abc6 9
456 abc7 8
456 abc8 9
我想根据“order_id”列添加一个自增列,预期结果是:
order_id item qty AutoIncrementingColumn_orderID
123 abc 1 1
123 abc1 4 2
234 abc2 5 1
234 abc3 2 2
234 abc4 7 3
123 abc5 5 3
456 abc6 9 1
456 abc7 8 2
456 abc8 9 3
我找不到基于另一列生成的解决方案,知道如何实现吗?
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql auto-increment