【发布时间】:2015-03-24 16:35:46
【问题描述】:
我正在尝试将 rdd 保存到 avro 格式的文件中。这就是我的代码的样子:
val output = s"/test/avro/${date.toString(dayFormat)}"
rmr(output)//deleteing the path
rdd.coalesce(64).saveAsNewAPIHadoopFile(
output,
classOf[org.apache.hadoop.io.NullWritable],
classOf[PageViewEvent],
classOf[AvroKeyValueOutputFormat[org.apache.hadoop.io.NullWritable,PageViewEvent]],
spark.hadoopConfiguration)
}
当我运行它时,我收到一条错误消息:
Unsupported input type PageViewEvent
rdd 的类型是 RDD[(Null,PageViewEvent)]。 有人可以解释我做错了什么吗? 在此先感谢
【问题讨论】:
标签: hadoop apache-spark avro