【发布时间】:2015-12-11 13:10:42
【问题描述】:
我正在尝试将文件名附加到文件中的每条记录。我想如果 RDD 是 Array,我会很容易做到这一点。
对于转换 RDD 类型或解决此问题的一些帮助将不胜感激!
在(字符串,字符串)类型中
scala> myRDD.first()(1)
scala><console>:24: error: (String, String) does not take parametersmyRDD.first()(1)
在数组中(字符串)
scala> myRDD.first()(1)
scala> res1: String = abcdefgh
我的功能:
def appendKeyToValue(x: Array[Array[String]){
for (i<-0 to (x.length - 1)) {
var key = x(i)(0)
val pattern = new Regex("\\.")
val key2 = pattern replaceAllIn(key1,"|")
var tempvalue = x(i)(1)
val finalval = tempvalue.split("\n")
for (ab <-0 to (finalval.length -1)){
val result = (I am trying to append filename to each record in the filekey2+"|"+finalval(ab))
}
}
}
【问题讨论】:
标签: scala apache-spark