【发布时间】:2015-05-21 13:16:49
【问题描述】:
我正在挖掘包含 14 种商品的 1000 笔交易的数据集中的模式。根据是否购买了该产品,每笔交易在产品列中都有 0 或 1。大多数变量的值为 0。
当我在这个数据集上使用先验算法时,最重要的规则是针对未购买的产品,例如: {var1=0, var2=0,var3=0} => {var4=0} 但是我更想知道哪些产品是一起购买的。
数据集: 反式 var1 var2 var3 var4 1 1 0 1 1 2 0 0 0 1 3 0 0 1 0 4 0 0 0 1 5 1 0 1 0 6 1 0 0 0
rules <- apriori(dataset,
parameter = list(minlen=3, supp=0.002, conf=0.2),
appearance = list(rhs=c("var1=1","var2=1","var3=1"),
lhs=c("var1=1","var2=1","var3=1"),
default="none"),
control = list(verbose=F))
首先,当我尝试运行它时,R studio 崩溃了。 第二点,我有兴趣将这段代码运行为:
rules <- apriori(dataset,
parameter = list(minlen=3, supp=0.002, conf=0.2),
appearance = list(rhs!=c("var1=0","var2=0","var3=0"),
lhs!=c("var1=0","var2=0","var3=0"),
default="none"),
control = list(verbose=F))
这是出错了!!
区别:!= 和 0 而不是 1 这样我就只在购买的物品上获得图案,而不是在未购买的物品上。
提前致谢!!
【问题讨论】:
标签: r analytics data-mining