【发布时间】:2022-01-07 09:37:33
【问题描述】:
我有一个数据集,其中的一列中有一个人的姓名,而另一列中有她为给定服务支付的金额。我想建立一个列表,其中包含所有人的姓名,这些人的姓名由他们支付的总金额决定,而不管他们执行的服务如何。示例:
Ann 100
John 200
Matt 150
John 150
John 150
Ann 300
Erik 150
===========
John 500
Ann 400
Matt 150
Erik 150
我认为这涉及查找该人姓名的所有重复实例,然后将支付的值存储在列中,最终总结所有内容。问题是我的列表太大,无法检查个人姓名。也就是说,我不能为要检查的每个名称定义一个特定的字符串,而是希望程序自己计算重复的实例并以我描述的方式返回指定的列表。有没有办法做到这一点?我懂一点 Python 和 R,所以用这些语言描述的任何方法都会特别有用。
【问题讨论】:
-
对于 R 方法,请在 How to sum a variable by group 常见问题解答中选择您最喜欢的答案。我建议
library(dplyr); your_data %>% group_by(name) %>% summarize(value = sum(value)),在我使用name和value的地方填写你的实际列名。 -
谢谢,我现在知道该采取什么方法了!
标签: python r dataset data-analysis