【发布时间】:2020-08-04 23:42:38
【问题描述】:
火花:2.4
数据框包含每个员工的平均登录时间
AverageLoginHour|employee
3.392265193 |emp_1
2.833333333 |emp_2
5.638888889 |emp_3
6.909090909 |emp_4
7.361445783 |emp_5
代码:
tds.select("Employee","AverageLoginHour")
(count("AverageLoginHour").alias("logincnt"))
(sum("AverageLoginHour").alias("loginsum"))
.withColumn("TotalEmployeeavg",col("loginsum")/col("logincnt")*100)
Error: Cannot resolve symbol .withcolumn
预期输出:
AverageLoginHour| employee Totalavg|Remarks
3.392265193 | Emp_1 |5.2 |Below Avg
2.833333333 | Emp_2 |5.2 |Below Avg
5.638888889 | Emp_3 |5.2 |Above Avg
6.909090909 | Emp_4 |5.2 |Above Avg
7.361445783 | Emp_5 |5.2 |Above Avg
如果员工 AverageLoginHour 小于 Totalavg than .withcolumn Remarks as below Avg else Above Avg.
请分享您的建议。
【问题讨论】:
标签: apache-spark apache-spark-sql