【发布时间】:2021-06-11 01:19:27
【问题描述】:
我希望我的问题听起来不像绕口令。
我有一个包含 2 列的表,一列(我们称之为“customer_ID”)是客户标识符,其他列(我们称之为“日期”)是该客户的购买日期。例如:
| Customer_ID | Date |
|---|---|
| 807x | 2010-2 |
| 807x | 2010-3 |
| 789y | 2010-2 |
| 789y | 2010-4 |
| 323z | 2010-1 |
| 323z | 2010-5 |
| 323z | 2010-6 |
有购买了一次的客户,也有购买了多次的客户。
我可以计算每个客户购买的次数:
df.groupby('customer_id').Count()
但是,我要计算的是每个值被计算的次数。 例如,如果客户 X 购买了 2 次,客户 Y 购买了 2 次,客户 Z 购买了 3 次,我想要这样的输出:
| Count | Repeated |
|---|---|
| 2 | 2 |
| 3 | 1 |
【问题讨论】:
-
.count().value_counts()?
-
@QuangHoang 对不起我的笨拙,但是当我创建表格时,虽然在预览中它们结果很好,但在创建帖子时它们以文本格式出现