【发布时间】:2017-04-21 03:54:45
【问题描述】:
我正在尝试找到一种方法来利用 pandas drop_duplicates() 来识别当值顺序相反时行是重复的。
例如,如果我试图查找客户同时购买苹果和香蕉的交易,但数据收集顺序可能已颠倒了这些项目。换句话说,当合并为完整订单时,交易被视为重复,因为它由相同的项目组成。
我希望将以下内容识别为重复项:
Item1 Item2
Apple Banana
Banana Apple
【问题讨论】:
标签: python-2.7 pandas duplicates