【问题标题】:How to convert RDD of Avro's GenericData.Record to DataFrame?如何将 Avro 的 GenericData.Record 的 RDD 转换为 DataFrame?
【发布时间】:2016-07-17 10:47:25
【问题描述】:

也许这个问题看起来有点抽象,这里是:

val originalAvroSchema : Schema   = // read from a file
val rdd : RDD[GenericData.Record] = // From some streaming source

// Looking for a handy:
val df: DataFrame   = rdd.toDF(schema)

我探索了spark-avro,但它只支持从文件中读取,而不是从现有的RDD 中读取。

【问题讨论】:

标签: scala apache-spark apache-spark-sql avro


【解决方案1】:
import com.databricks.spark.avro._

val sqlContext = new SQLContext(sc)
val rdd : RDD[MyAvroRecord] = ...
val df = rdd.toAvroDF(sqlContext)

【讨论】:

    猜你喜欢
    • 2019-07-02
    • 2018-03-30
    • 2017-10-30
    • 1970-01-01
    • 1970-01-01
    • 2020-01-24
    • 1970-01-01
    • 2017-06-02
    • 2019-09-09
    相关资源
    最近更新 更多