【发布时间】:2021-01-04 15:30:14
【问题描述】:
我需要在我的数据框中计算 customer_unique_id 中的唯一值并创建一个新列/变量来计算 customer_unique_id 出现的次数,删除行以仅保留一个 customer_unique_id 并最终创建一个新的类别变量。
数据框:
customer_unique_id order_id category
ef54 '0024' gift
ab58 '0587' school
yg41 '0678' gift
af48 '0469' gift
ef54 '8514' school
af48 '2771' gift
预期的数据帧输出:
customer_unique_id order_id category number_of_orders category_2
ef54 '0024' gift 2 school
ab58 '0587' school 1 Nan
yg41 '0678' gift 1 Nan
af48 '0469' gift 2 gift
对我来说最重要的是了解如何创建变量 numer_of_orders,但 category_2 将是一个奖励。
每个 customer_unique_id 我的订单不超过两个。
【问题讨论】:
-
也许可以考虑使用 pd.DataFrame.groupby.transform :pandas.pydata.org/pandas-docs/stable/reference/api/…
标签: python pandas dataframe unique