【发布时间】:2021-10-16 17:14:19
【问题描述】:
我们正在以 RDD[(String,String)] 格式读取 UTF_8 文件,需要帮助将其转换为 RDD[String]。
val textRdd = sparkSession.sparkContext.binaryFiles(filePath,12)
.mapValues(content => new String(content.toArray(), StandardCharsets.UTF_8))
【问题讨论】:
标签: scala apache-spark rdd