【发布时间】:2015-12-14 07:02:06
【问题描述】:
我的目标是制定关于诊断数据的重要规则。
我以 arff no sparse 格式预处理我的数据集;我有 116000 个实例和 28 个属性。 我像这样在 weka 中应用 Apriori 算法(使用 weka explorer 界面)
Apriori -N 20 -T 1 -C 0.8 -D 0.05 -U 1.0 -M 0.1 -M 0.1 -S -1.0 -c -1
算法似乎需要很长时间才能完成。 目前还有三个多小时等待完结。
正常吗?有一种方法可以加快算法速度(以其他方式预处理数据,或者为 Apriori 选择其他参数)?或者 weka 不是这个维度的正确工具?
【问题讨论】:
-
不幸的是,Weka 通常很慢。尝试 A)使用 ELKI、SPMF 或 Christian Borgelt 的 C 实现,这应该更快,B)FPGrowth 算法而不是 Apriori。
标签: weka data-mining apriori