【发布时间】:2018-03-06 06:28:12
【问题描述】:
我有一个Any 类型的RDD,例如:
Array(List(Mathematical Sciences, ListBuffer(applications, asymptotic, largest, enable, stochastic)))
我想把它转换成RDD[(String, Seq[String])]类型的RDD
我试过了:
val rdd = sc.makeRDD(strList)
case class X(titleId: String, terms: List[String])
val df = rdd.map { case Array(s0, s1) => X(s0, s1) }.toDF()
我试了很久没有成功
【问题讨论】:
-
我想将 rdd 类型 Array(List([String], ListBuffer([string])) 转换为 RDD(String, Seq[String]) 示例:Array(List(Mathematical Sciences, ListBuffer(applications , asymptotic, maximum, enable, stochastic))) 我想将其转换为 rdd Array(Mathematical Sciences, ListBuffer(applications, asymptotic, maximum, enable, stochastic))
-
左下角有一个灰色的“编辑”按钮。
标签: scala apache-spark rdd