【发布时间】:2020-03-17 20:39:45
【问题描述】:
我有一个 pyspark 数据框 df
+------------+------+
| timestamp | days |
+------------+------+
| 2019-11-21 | 5 |
| 2019-10-22 | 21 |
| ... | ... |
+------------+------+
我想从时间戳中减去天数
import pyspark.sql.functions as F
df.withColumn("timestamp", F.date_add(F.col("timestamp"), -F.col("days")))
预期的结果是
+------------+------+
| timestamp | days |
+------------+------+
| 2019-11-16 | 5 |
| 2019-10-01 | 21 |
| ... | ... |
+------------+------+
但我只收到错误TypeError: Column is not iterable
有没有办法让它工作?
【问题讨论】:
-
具体:
df.withColumn("timestamp", F.expr("date_add(timestamp, -days)") -
这个效果更好!请添加您的答案。
-
它与我链接的副本相同。您可以接受副本并自行关闭。