【问题标题】:Weka Apriori AlgorithmWeka Apriori 算法
【发布时间】:2013-05-08 03:28:12
【问题描述】:

我想使用 Apriori 对交易数据进行亲和力分析。我有一张包含订单列表及其信息的表格。我主要需要使用 OrderID 和 ProductID 属性,格式如下

订单ID 产品ID
1个
1 乙
1 C
2个
2 C
3个

Weka 要求您为每个产品 ID 创建一个名义属性,并使用如下所示的 true 或 false 值指定商品是否存在于订单中:

1,对,对,对
2、对、错、对
3、对、错、错

我的数据集包含大约 10k 条记录……大约 3k 种不同的产品。谁能建议一种以这种格式创建数据集的方法? (除了手动耗时的方式......)

【问题讨论】:

    标签: data-mining weka apriori


    【解决方案1】:

    写个脚本来转换怎么样?

    在 Python 等良好的脚本语言中应少于 10 行。

    或者您可以查看根据需要旋转关系的选项。

    不管怎样,这是一个直接的编程任务,所以我在这里看不到你的问题。

    【讨论】:

    • 嗯,我是一个刚刚开始尝试这些东西的学生,所以它对我来说并不是一个“直接的编程任务”,可能还有很多其他人,因为我看起来非常相似未回答的问题。非常感谢。
    • 是的,这里有很多题外话。该站点用于编程问题,您显然还没有尝试自己使用简单的代码来解决这个问题。
    【解决方案2】:

    您显然需要转换数据。最简单的方法:编写一个软件,以您最熟悉的编程语言读取文件,然后以适当的格式编写文件。既然是文本文件,应该不会太复杂。

    顺便说一句,如果你想要更多的模式挖掘和关联挖掘算法,而不仅仅是 Weka 中的 Apriori,你可以查看我的软件 SPMF (http://www.philippe-fournier-viger.com/spmf/),它也是 Java 版本,也可以读取 ARFF 文件,提供大约 50 个专门用于模式挖掘的算法(Apriori FPGrowth 等。

    【讨论】:

      【解决方案3】:

      您的数据按原样正确格式化,以便使用 ARULES 包(和 apriori 函数)在 R 中实现。你可以考虑检查一下,特别是。如果你无法进入脚本编码。

      【讨论】:

        猜你喜欢
        • 2015-08-11
        • 2016-01-03
        • 2015-11-06
        • 2015-03-18
        • 2016-01-03
        • 1970-01-01
        • 1970-01-01
        • 2013-03-19
        • 2020-04-29
        相关资源
        最近更新 更多