【问题标题】:Group by in Orange, Data mining在 Orange 中分组,数据挖掘
【发布时间】:2021-11-16 03:48:33
【问题描述】:

我有一个超市的数据集,包含商品的每笔交易都以一行表示。因此,如果事务 1 包含牛奶、面包和咖啡,则这些项目位于单独的行中,并且属性事务发生 3 次。我想要做的是按项目对交易进行分组,以便所有项目都连接在一列中。然后最后应用关联规则并将列中的每个项目分隔为项目集。这在 Orange 中是否可行?

值得一提的是,我在 RapidMiner 中使用相同的数据集轻松做到了这一点。我使用了 Aggregate 运算符,连接项目属性,然后按事务分组。

【问题讨论】:

    标签: pandas data-mining orange


    【解决方案1】:

    如果我理解正确,您希望聚合列,而不是行。如果是这样,则有可用的聚合列小部件。要对行执行 Group by,目前有 Pivot,它具有 Group by 输出。我们正在开发一个单独的 Group by 小部件,它应该会在下一个版本中提供。

    【讨论】:

    • 感谢您的回答!我查看了这两个小部件,它们正在产生我正在寻找的结果。我是新手,所以我可能会遗漏一些东西。下面是数据集的样子:ibb.co/jWD48W6 我想找到项目之间的关联规则。选择列 Item 显然不会产生我正在寻找的结果。如果有另一种方法可以使数据适合关联规则小部件,我很乐意使用这种技术!
    • 我明白了。您正在寻找的称为数据透视表,其中行将是事务 ID,列项和值将是事务值。唯一的问题是 Pivot Table 将这些列输出为连续的而不是离散的,因此很难与 Associate 插件一起使用。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-04-07
    • 1970-01-01
    • 2014-02-02
    • 2010-10-21
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多