【发布时间】:2023-03-12 11:15:01
【问题描述】:
我将RDD[Long] 称为mod,我想使用 Spark 2.2 和 Scala 2.11.8 计算此 RDD 的标准差和平均值。
我该怎么做?
我尝试如下计算平均值,但有没有更简单的方法来获得这些值?
val avg_val = mod.toDF("col").agg(
avg($"col").as("avg")
).first().toString().toDouble
val stddev_val = mod.toDF("col").agg(
stddev($"col").as("avg")
).first().toString().toDouble
【问题讨论】:
标签: scala apache-spark apache-spark-sql