【发布时间】:2018-03-31 20:19:29
【问题描述】:
如何将一组任意列转换为 Mllib Vector? 基本上,我的 DataFrame 的第一列具有固定名称,然后是多个任意命名的列,每个列内部都有 Double 值。
像这样:
name | a | b | c |
val1 | 0.0 | 1.0 | 1.0 |
val2 | 2.0 | 1.0 | 5.0 |
可以是任意数量的列。我需要获取以下数据集:
final case class ValuesRow(name: String, values: Vector)
【问题讨论】:
标签: scala apache-spark apache-spark-sql dataset apache-spark-mllib