【发布时间】:2018-07-13 21:35:25
【问题描述】:
我正在尝试将使用Dataframe 编写的代码转换为DataSet API。
问题是我将 JavaRDD 创建为:
final JavaRDD<String> abcJavaRdd= jsc.textFile("/path/to/textfile");
但是sqlContext类的createDataset方法需要RDD<T>类型而不是JavaRDD<T>类型。
SQLContext sqlc = new SQLContext(jsc);
....
....
Encoder<Abc> abcEncoder= Encoders.bean(Abc.class);
Dataset<Abc> abcDataset= sqlc.createDataset(abcJavaRdd, abcEncoder);
上面代码的最后一行不起作用。
我想知道如何从“org.apache.spark.api.java.JavaRDD”类型创建“org.apache.spark.rdd.RDD”类型?
我在 mapr 集群上使用 Java 1.8 和 apache spark 1.6.1。
【问题讨论】:
标签: java apache-spark apache-spark-sql apache-spark-dataset