【发布时间】:2017-03-14 18:45:59
【问题描述】:
我想用逗号分隔值处理 RDD 中的每一行。我想要实现的是将所有接近零的值设置为实际零。这就是我所做的。
val newRDD = oldRDD
.map (line => line.split(","))
.map (line => for(value <- line) {
if(value.toDouble >= -0.01 && value.toDouble <= 0.01)
0.toString()
else
value
}
)
我得到的只是所有行的括号 ()。我犯了一些愚蠢的错误吗?
谢谢。
【问题讨论】:
标签: scala apache-spark rdd