【发布时间】:2015-03-04 22:21:29
【问题描述】:
我有一个非常愚蠢的问题,我知道 RDD 是不可变的,但是有什么方法可以将一列常量添加到 RDD 中?
更具体地说,我有一个 RDD[a:String, b:String] 的 RDD,我希望在它之后添加一列 1,以便我有一个 RDD[a:Stirng, b:String, c :诠释]。
原因是我想使用reduceByKey函数来处理这些字符串,一个任意的Int(将不断更新)将有助于该函数减少。
【问题讨论】:
标签: scala apache-spark rdd