【发布时间】:2021-11-19 20:29:28
【问题描述】:
我正在使用 pandas,并且我试图找出一种方法来获得人们在我的数据文件中使用的最常见的产品组合。
假设接下来三个AA、BB和CC的每一列代表一个完全不同的产品,0值表示我不使用这个产品,1表示我使用它。此外,每一行代表一个完全不同的买家。
例如,在我的示例中,最常见的组合是产品 AA 和 CC,因为我有三个人使用它们,如您在第 1、4、5 行中看到的那样。
我的结果是“最常见的组合是 3 人使用的产品 AA 和 CC”。
希望这次能更好的解释给你
以下是我的 DataFrame 的示例:
AA | BB | CC
_______________
1 | 0 | 1
0 | 0 | 1
0 | 1 | 0
1 | 0 | 1
1 | 0 | 1
【问题讨论】:
-
请解释为什么您的预期结果 AA CC 被认为是最好的背后的逻辑?此外,请编辑您的问题以显示一个最小的可重现集,其中包括样本输入、预期输出、实际输出以及重现问题所需的相关代码。请参阅Minimal Reproducible Example,了解如何最好地帮助我们。
-
@wjandrea 非常感谢,但我已经尝试过与您的建议相同的方法,但正如我在问题中解释的那样,我不想得到总和或类似的东西,我需要得到名字每个客户在数据框中有 1 个列
-
@GeoP 这不是总和,而是行数。如果你不计算它们,你应该如何找到最常见的行?也就是说,这只是第一步。我会给你写一个答案。
标签: python pandas combinations