【发布时间】:2021-01-30 01:03:56
【问题描述】:
我有 Spark 数据帧,其中时间戳以毫秒为单位。
+-----------------------+
|CALC_TS |
+-----------------------+
|2021-01-27 01:35:05.043|
|2021-01-27 01:35:05.043|
|2021-01-27 01:35:05.043|
我想让它像这样显示微秒:
+--------------------------+
|CALC_TS |
+--------------------------+
|2021-01-27 01:35:05.043000|
|2021-01-27 01:35:05.043000|
|2021-01-27 01:35:05.043000|
所以基本上我希望毫秒部分以微秒为单位显示。在上面的示例中,第一个数据帧的43 毫秒为43 thousand 微秒,如秒数据帧所示。
我试过了:
df.withColumn('TIME', to_timestamp('CALC_TS', 'yyyy-MM-dd HH:mm:ss.SSSSSS'))
和
df.withColumn('TIME', col('CALC_TS').cast("timestamp"))
但是他们给出了相同的结果并去掉了最后 3 个零。有没有办法做到这一点?
【问题讨论】:
-
@Paul,不幸的是,这对我不起作用。我在查看该帖子时遇到了该帖子。谢谢你。
标签: apache-spark pyspark apache-spark-sql