【发布时间】:2018-03-13 16:46:05
【问题描述】:
我正在从文件中读取数据,并且已经到达数据类型为 Iterator[char] 的位置。有没有办法将 Iterator[char] 转换为 RDD[String]?然后我可以使用案例类转换为 Dataframe/Dataset。
下面是代码:
val fileDir = "inputFileName"
val result = IOUtils.toByteArray(new FileInputStream (new File(fileDir)))
val remove_comp = result.grouped(171).map{arr => arr.update(2, 32);arr}.flatMap{arr => arr.update(3, 32); arr}
val convert_char = remove_comp.map( _.toChar)
这个返回convert_char:Iterator[Char] = 非空迭代器
谢谢
【问题讨论】:
-
你真正想要达到什么目的?如果你想读取一个文件只是
spark.read.text或类似的。
标签: apache-spark