【发布时间】:2021-07-25 22:53:57
【问题描述】:
我想按邮政编码对以下类型的数据集进行分组,并计算每种运输方式在每个邮政编码中所占的已完成订单份额。 我已经实现了一个 csv 文件并尝试了下面的代码,但我意识到我需要 MultiIndex ——因为我有很多不同的邮政编码,所以我不确定如何使用它。
| postalcode | shipping_method | completed_orders |
|---|---|---|
| 12345 | post1 | 1 |
| 12345 | post2 | 3 |
| 12345 | post3 | 2 |
| 11123 | post1 | 1 |
| 11123 | post2 | 2 |
import numpy as np
import pandas as pd
shipping_data = pd.read_csv("shipping_per_postalcode.csv")
shareof = lambda x: x/x.sum()
result = shipping_data['amount_users_completed'].groupby(level=['postalcode', 'shipping_option']).transform(sumto)
print(result)
【问题讨论】:
标签: python pandas pandas-groupby aggregation percentage