【发布时间】:2021-02-18 16:21:34
【问题描述】:
我有两个数据框:
df1:
c1 c2 c3
1 192 1
3 192 2
4 193 3
5 193 3
7 193 5
9 194 7
df2:
v1
192
193
194
我想在df2中添加新列,结果是:
df2:
v1 v2
192 2
193 2
194 1
解释:v1=193,df1中有3行,对应的c3为3\3\5 不同的值是 3 和 5,计数是 2,所以 df2 中的 v2 是 2
谢谢,python版本最好。
【问题讨论】:
标签: apache-spark pyspark apache-spark-sql