【发布时间】:2017-04-23 03:23:00
【问题描述】:
如果我想在 Spark DataSet 列中存储代数数据类型 (ADT)(即 Scala 密封特征层次结构),最佳编码策略是什么?
例如,如果我有一个叶类型存储不同类型数据的 ADT:
sealed trait Occupation
case object SoftwareEngineer extends Occupation
case class Wizard(level: Int) extends Occupation
case class Other(description: String) extends Occupation
什么是构建a的最佳方法:
org.apache.spark.sql.DataSet[Occupation]
【问题讨论】:
标签: scala apache-spark apache-spark-dataset apache-spark-encoders