Weka Apriori 算法答案

【问题标题】：Weka Apriori AlgorithmWeka Apriori 算法
【发布时间】：2013-05-08 03:28:12
【问题描述】：

我想使用 Apriori 对交易数据进行亲和力分析。我有一张包含订单列表及其信息的表格。我主要需要使用 OrderID 和 ProductID 属性，格式如下

订单ID 产品ID
1个
1 乙
1 C
2个
2 C
3个

Weka 要求您为每个产品 ID 创建一个名义属性，并使用如下所示的 true 或 false 值指定商品是否存在于订单中：

1，对，对，对
2、对、错、对
3、对、错、错

我的数据集包含大约 10k 条记录……大约 3k 种不同的产品。谁能建议一种以这种格式创建数据集的方法？（除了手动耗时的方式......）

【问题讨论】：

标签： data-mining weka apriori

【解决方案1】：

写个脚本来转换怎么样？

在 Python 等良好的脚本语言中应少于 10 行。

或者您可以查看根据需要旋转关系的选项。

不管怎样，这是一个直接的编程任务，所以我在这里看不到你的问题。

【讨论】：

嗯，我是一个刚刚开始尝试这些东西的学生，所以它对我来说并不是一个“直接的编程任务”，可能还有很多其他人，因为我看起来非常相似未回答的问题。非常感谢。
是的，这里有很多题外话。该站点用于编程问题，您显然还没有尝试自己使用简单的代码来解决这个问题。

【解决方案2】：

您显然需要转换数据。最简单的方法：编写一个软件，以您最熟悉的编程语言读取文件，然后以适当的格式编写文件。既然是文本文件，应该不会太复杂。

顺便说一句，如果你想要更多的模式挖掘和关联挖掘算法，而不仅仅是 Weka 中的 Apriori，你可以查看我的软件 SPMF (http://www.philippe-fournier-viger.com/spmf/)，它也是 Java 版本，也可以读取 ARFF 文件，提供大约 50 个专门用于模式挖掘的算法（Apriori FPGrowth 等。

【讨论】：

【解决方案3】：

您的数据按原样正确格式化，以便使用 ARULES 包（和 apriori 函数）在 R 中实现。你可以考虑检查一下，特别是。如果你无法进入脚本编码。

【讨论】：