【发布时间】:2016-04-04 18:19:29
【问题描述】:
我有一个数据框,其中包含具有数百个不同值的分类变量。
我可以使用 groupby 语句 + reset_index() 的“values_count()”函数验证这些级别的频率...
我试图用它们的频率计数替换这数百个值(后来在低基数的合并级别上)。我试图加入两个不同的数据框(一个带有值,另一个带有计数),但我遇到了问题......
例如,频率表如下,大约有 300 条记录(都是唯一的):
v_catego Time
0 AA 353
1 AAC 136
2 ABB 2
3 ABC 1
4 ACA 13
300 ZZZ 33
原始数据框:
V_vatego
0 AA
1 AAC
2 ABB
3 AAC
4 DA
5 AAC
................
我想用每个实例的“时间”值替换(或添加另一个)变量:
v_catego new_v_catego
0 AA 353
1 AAC 136
2 ABB 2
3 AA 353
4 AAC 136
.................
我知道在 R 中有一个简单的函数可以做到这一点。 python中是否有等价物?
【问题讨论】: