【发布时间】:2021-09-29 15:47:38
【问题描述】:
我很难做到这一点:
我有什么:熊猫数据框:
product seller price
A Yo 10
A Ka 5
A Poy 7.5
A Nyu 2.5
A Poh 1.25
B Poh 11.25
我想要什么:
给定一个类似上面product, seller, price的df,我想根据该特定产品的价格列计算4个四分位数,并将该产品的每个卖家的价格分类到这些四分位数中。
当所有价格都相同时,4 个四分位数的值相同,价格被归类为第 1 个四分位数
预期输出:
product seller price Quartile 1Q 2Q 3Q 4Q
A Yo 10 4 2.5 5 7.5 10
A Ka 5 2 2.5 5 7.5 10
A Poy 7.5 3 2.5 5 7.5 10
A Nyu 2.5 1 2.5 5 7.5 10
A Poh 1.25 1 2.5 5 7.5 10
B Poh 11.25 1 11.25 11.25 11.25 11.25
到目前为止我做了什么:
如果我使用:df['Price'].quantile([0.25,0.5,0.75,1]),它将计算所有价格的 4 个四分位数而不按产品过滤,所以它是错误的。
我迷路了,因为我不知道如何在 python 中执行此操作。
任何人都可以在这里给我一些启示吗?
谢谢
@Hamza,看看下面的输出。还是有一些东西不能正常工作
【问题讨论】:
标签: python-3.x pandas numpy