【发布时间】:2015-11-06 13:01:22
【问题描述】:
我正在尝试在Weka 中应用 Apriori 算法。
维基百科有一个简单的例子(Apriori algorithm):
alpha beta epsilon
alpha beta theta
alpha beta epsilon
alpha beta theta
从该表中可以确定以下关联规则:
- 100% 的带有
alpha的集合也包含beta - 50% 的集合有
alpha,测试版也有epsilon - 50% 的集合有
alpha,测试版也有theta
我将这些条目转换为 CSV 并添加了另一个属性行,所以我终于有了这个文件:
prod1,prod2,prod3
alpha,beta,epsilon
alpha,beta,theta
alpha,beta,epsilon
alpha,beta,theta
我将它加载到 Weka 并单击“关联”选项卡,默认选择“Apriori”算法。
结果我得到以下信息:
1. prod2=beta 4 ==> prod1=alpha 4 conf:(1)
2. prod1=alpha 4 ==> prod2=beta 4 conf:(1)
3. prod3=epsilon 2 ==> prod1=alpha 2 conf:(1)
4. prod3=theta 2 ==> prod1=alpha 2 conf:(1)
5. prod3=epsilon 2 ==> prod2=beta 2 conf:(1)
6. prod3=theta 2 ==> prod2=beta 2 conf:(1)
7. prod2=beta prod3=epsilon 2 ==> prod1=alpha 2 conf:(1)
8. prod1=alpha prod3=epsilon 2 ==> prod2=beta 2 conf:(1)
9. prod3=epsilon 2 ==> prod1=alpha prod2=beta 2 conf:(1)
10. prod2=beta prod3=theta 2 ==> prod1=alpha 2 conf:(1)
但我也想要维基百科示例中的频率(见上文)。
【问题讨论】:
标签: algorithm associations weka data-mining apriori