【发布时间】:2017-03-01 14:48:39
【问题描述】:
我有以下问题:
- 一个
DataFrame包含col1和字符串A、B或C。 - 第二个
col2和Integer。 - 还有另外三列
col3、col4和col5(这些列也被命名为A、B和C)。
因此,
col1 - col2 - A (col3) - B (col4) - C (col5)
|--------------------------------------------
A 6
B 5
C 6
应该得到
col1 - col2 - A (col3) - B (col4) - C (col5)
|--------------------------------------------
A 6 6
B 5 5
C 6 6
现在我想遍历每一行并根据col1 中的条目将col2 中的整数分配给A、B 或C 列。
我如何做到这一点?
df.withColumn() 我不能使用(或者至少我不知道为什么),val df2 = df.map(x => x ) 也是如此。
期待您的帮助,提前致谢!
最好的,肯
【问题讨论】:
标签: scala apache-spark dataframe apache-spark-sql