【发布时间】:2018-12-27 11:45:52
【问题描述】:
我有一个带有date 列的数据框,该列表示String 格式的 Unix 时间戳。列值需要格式化为不同的字符串表示形式,如下所示 -
输入数据帧
+----+----+-------------+
|name|code| date|
+----+----+-------------+
| A| 1|1545905416000|
| B| 3|1545905416000|
| C| 5|1545905416000|
+----+----+-------------+
预期输出数据帧
+----+----+-------------+
|name|code| date|
+----+----+-------------+
| A| 1| 2018-12-27|
| B| 3| 2018-12-27|
| C| 5| 2018-12-27|
+----+----+-------------+
这不起作用,因为它为所有值提供null -
peopleDFCsv.withColumn("formatted_date",
functions.date_format(functions.col("date"), "yyyy-MM-dd"))
.show();
【问题讨论】:
标签: date apache-spark apache-spark-sql timestamp