【发布时间】:2021-03-18 18:48:11
【问题描述】:
如何在 spark 中将字符串 2018-03-21 08:15:00 +03:00 存储为 timestamptype,保留 UTC 偏移量?
在下面尝试过
from pyspark.sql.functions import *
df = spark.createDataFrame([("2018-03-21 08:15:00 +03:00",)], ["timestamp"])
newDf= df.withColumn("newtimestamp", to_timestamp(col('timestamp'), "yyyy-MM-dd HH:mm:ss XXX")
)
这将打印 newtimestamp 列,其值转换为 UTC 时间,即 2018-03-21 05:15:00
如何将此字符串作为时间戳列存储在数据帧中保留偏移量,即将相同的字符串存储为时间戳或存储为 2018-03-21 08:15:00 +3000
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql datetime-format