【发布时间】:2019-11-14 06:45:39
【问题描述】:
我想将来自不同数据帧的两列合并到一个数据帧中
我有两个这样的 DataFrame
val ds1 = sc.parallelize(Seq(1,0,1,0)).toDF("Col1")
val ds2 = sc.parallelize(Seq(234,43,341,42)).toDF("Col2")
ds1.show()
+-----+
| Col1|
+-----+
| 0|
| 1|
| 0|
| 1|
+-----+
ds2.show()
+-----+
| Col2|
+-----+
| 234|
| 43|
| 341|
| 42|
+-----+
我想要包含两列 Col1 和 Col2 的第三个数据框
+-----++-----+
| Col1|| Col2|
+-----++-----+
| 0|| 234|
| 1|| 43|
| 0|| 341|
| 1|| 42|
+-----++-----+
我试过联合
val ds3 = ds1.union(ds2)
但是,它将ds2 的所有行添加到ds1。
【问题讨论】:
-
是否要将另一列中每一行的值相加?
标签: scala apache-spark