【发布时间】:2020-09-30 02:24:03
【问题描述】:
我有一个相当大的数据集,看起来类似于下面。此数据集包含 10 多个列,它们都具有相同的值,然后是一个包含唯一值的“时间”列。
我正在尝试为重复的每一行总结时间列,对不重复的行不做任何事情。
df1 = pd.DataFrame({'names':['Paul','George','Paul','John'],
'Time':[10,41,22,10],
'Date':['10/2/20', '10/1/20', '10/2/20','10/1/20']})
我尝试对所有可能包含重复项的列进行 groupby,然后汇总 Time 并重置索引,但是行数少于将其与手动完成的电子表格进行比较时的行数.
提前感谢您的任何建议!
【问题讨论】:
-
请用您的预期输出更新问题。
标签: python-3.x pandas sum duplicates pandas-groupby