【发布时间】:2021-07-20 00:06:42
【问题描述】:
我正在尝试在我的数据框中找到相同的订单,看起来与此类似 -
Order_ID |SKU |Qty |
123 | A | 1 |
123 | B | 2 |
345 | A | 1 |
345 | B | 2 |
678 | A | 1 |
678 | C | 3 |
一个订单可以有多个 SKU,即 1 个订单可以有多行。 所以包含确切 SKU 和数量的 order_ID 是相同的。这里是 123 和 345。 我需要与 SKU 和数量相同的订单。
如何在 pandas 数据框中使用分组来实现这一点?
示例输出类似于 -
Order_ID | SKU | Qty |Unique_Orders
[123] , [345]| [A],[B] | [1],[2] |2
[678] | [A],[C] | [1],[3] |1
感谢您的帮助。
【问题讨论】:
-
有很多方法可以找到这样的组,但这取决于你想用它们做什么。任何想要的输出?例如,您可以对
qty求和、计算行数、计算不同的 sku 等。 -
如果您只想要什么是唯一的 order_id,您可以使用 df['order_id'].unique() 列出它们,但同样取决于您列出 @PierreD 所说的那些唯一的 order_id 跨度>
标签: python pandas dataframe pandas-groupby