【发布时间】:2018-07-30 23:52:28
【问题描述】:
我有一个带有客户退款原因的 Pandas DataFrame。 它包含这些示例数据行:
**case_type** **claim_type**
1 service service
2 service service
3 chargeback service
4 chargeback local_charges
5 service supplier_service
6 chargeback service
7 chargeback service
8 chargeback service
9 chargeback service
10 chargeback service
11 service service_not_used
12 service service_not_used
我想将客户的原因与某种标记的原因进行比较。这没问题,但我还想查看特定组中的记录总数(客户原因)。
case_claim_type = df[["case_type", "claim_type"]]
case_claim_type.groupby(by=("case_type", "claim_type"))["case_type"].count()
这给了我这个输出,例如:
**case_type** **claim_type**
service service 2
supplier_service 1
service_not_used 2
chargeback service 6
local_charges 1
我还想要每个 case_type 的输出总和。比如:
**case_type** **claim_type**
service service 2
supplier_service 1
service_not_used 2
total: 5
chargeback service 6
local_charges 1
total: 7
它不一定必须是最后一种输出格式,每个 case_type 的(聚合)总计的列也可以。
【问题讨论】:
-
你能提供一些示例输入数据吗?
-
@ScottBoston 是的,我刚刚添加了一些示例输入数据
标签: python python-3.x pandas dataframe pandas-groupby