【发布时间】:2019-02-08 00:27:51
【问题描述】:
我有一个 PySpark 数据框,如下所示:
+---+----+----+
| id|day1|day2|
+---+----+----+
| 1| 2| 4|
| 2| 1| 2|
| 3| 3| 3|
+---+----+----+
我想将每一行复制 n 次 n = day2 - day1。生成的数据框如下所示:
+---+----+----+
| id|day1|day2|
+---+----+----+
| 1| 2| 4|
| 1| 2| 4|
| 1| 2| 4|
| 2| 1| 2|
| 2| 1| 2|
| 3| 3| 3|
+---+----+----+
我该怎么做?
【问题讨论】: