【发布时间】:2022-01-07 09:55:04
【问题描述】:
目标:从列的前 N 个不同值中提取 list。
Distinct,意思是彼此不同但不是唯一的对于整个DataFrame。
例如,col A 的前 5 个不同值。
数据帧:
A B C
0 BERT foo bar
1 BERT foo bar
2 MLP foo bar
3 Albert foo bar
4 Albert foo bar
5 Albert foo bar
6 Roberta foo bar
7 Roberta v2 foo bar
8 Roberta v2 foo bar
9 BigBird foo bar
10 Muppet foo bar
期望的输出:
top_5 = ['BERT', 'MLP', 'Albert', 'Roberta', 'Roberta v2']
实际上,忽略重复值和所有其他先前的不同值。
如果我在这篇文章中还有什么需要澄清的,请告诉我。
【问题讨论】:
标签: python pandas list dataframe if-statement