【发布时间】:2013-05-08 03:28:12
【问题描述】:
我想使用 Apriori 对交易数据进行亲和力分析。我有一张包含订单列表及其信息的表格。我主要需要使用 OrderID 和 ProductID 属性,格式如下
订单ID 产品ID
1个
1 乙
1 C
2个
2 C
3个
Weka 要求您为每个产品 ID 创建一个名义属性,并使用如下所示的 true 或 false 值指定商品是否存在于订单中:
1,对,对,对
2、对、错、对
3、对、错、错
我的数据集包含大约 10k 条记录……大约 3k 种不同的产品。谁能建议一种以这种格式创建数据集的方法? (除了手动耗时的方式......)
【问题讨论】:
标签: data-mining weka apriori