【发布时间】:2020-06-23 04:15:51
【问题描述】:
我有一个如下所示的数据框:
'id': ["1", "2", "1", "3", "3", "4"],
'date': ["2017", "2011", "2019", "2013", "2017", "2018"],
'code': ["CB25", "CD15", "CZ10", None, None, "AZ51"],
'col_example': ["22", None, "22", "55", "55", "121"],
'comments': ["bonjour", "bonjour", "bonjour", "hola", "Hello", None]
结果:
id date code col_example .... comments
0 1 2019 CB25/CZ10 22 .... bonjour (and not bonjour // bonjour)
1 2 2011 CD15 None .... bonjour
2 3 2017 None 55 .... hola // Hello
3 4 2018 AZ51 121 .... None
我想保留一个ID
如果两个 id 相同,我想:
如果 cmets = None 和 = str:只保留非 None 的 cmets(例如:id = 1,保留 cmets “hello”) if two cmets = str: 用“//”连接两个 cmets(例如 id = 3, cmets = "hola // hello")
目前我尝试使用 sort_value,但 drop_duplicate 没有成功
谢谢
【问题讨论】:
-
你能添加预期的输出DataFrame吗?
标签: python-3.x pandas dataframe concat