【发布时间】:2017-01-20 17:16:33
【问题描述】:
我正在尝试使用RDD 创建一个DataFrame。
首先我使用下面的代码创建一个RDD -
val account = sc.parallelize(Seq(
(1, null, 2,"F"),
(2, 2, 4, "F"),
(3, 3, 6, "N"),
(4,null,8,"F")))
一切正常——
帐户:org.apache.spark.rdd.RDD[(Int, Any, Int, String)] = ParallelCollectionRDD[0] at parallelize at :27
但是当尝试使用下面的代码从RDD 创建DataFrame 时
account.toDF("ACCT_ID", "M_CD", "C_CD","IND")
我遇到错误
java.lang.UnsupportedOperationException:Any 类型的架构不是 支持
我分析,每当我将null 值放入Seq 时,只有我得到了错误。
有没有办法添加空值?
【问题讨论】:
-
使用
(1, null: Integer, 2,"F")
标签: scala apache-spark spark-dataframe apache-spark-dataset