【发布时间】:2021-07-24 03:14:20
【问题描述】:
我是 pyspark 和 Spark SQL 的新手。我有一个数据框,其中一列具有字符串中的日期时间值,我需要将其转换/转换为时间戳。
数据帧格式:
+--------------------+------------------------------+
| value| time_from_text|
+--------------------+------------------------------+
|dummy |2020-04-19T23:49:52.020000453Z|
|dummy |2020-04-22T23:52:52.020000453Z|
+--------------------+------------------------------+
现在,我查看this post并尝试了以下代码sn-p:
result.withColumn("Timestamp",unix_timestamp("time_from_text", "yyyy-MM-dd'T'HH:mm:ss.SSSSSSSSS'Z'").cast(TimestampType()))
这在我之前的 spark 版本为 3.1.1 的情况下确实有效。但是,我需要切换回 2.4.6,在这里,相同的代码给了我 null 作为时间戳的输出!
我尝试了许多不同的方法,但无法投射时间戳。
任何指针将不胜感激。感谢您的帮助!
【问题讨论】:
标签: apache-spark pyspark timestamp unix-timestamp