【发布时间】:2020-10-15 03:20:17
【问题描述】:
我有一个带有以下架构的产品数据的 df
root
|-- Creator: string (nullable = true)
|-- Created_datetime: timestamp (nullable = true)
|-- Last_modified_datetime: timestamp (nullable = true)
|-- Product_name: string (nullable = true)
Created_datetime 的列如下所示
+-------------------+
| Created_datetime|
+-------------------+
|2019-10-12 17:09:18|
|2019-12-03 07:02:07|
|2020-01-16 23:10:08|
现在我想提取Created_datetime 列中的平均值(或与现有平均值最接近的值)。如何实现?
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql