【问题标题】:how to select top association rules如何选择顶级关联规则
【发布时间】:2016-07-07 10:31:25
【问题描述】:

给定的规则按其提升比的降序排列并且大于 1。 下面需要前 3 条规则。

前因——后因
A,B -- C,D
A -- C,D
A,C -- B,D
C,D -- A,B

我应该立即考虑前 3 条规则吗?

【问题讨论】:

  • 为什么不考虑他们?
  • @Anony-Mousse:正如 Manish 在下面的 cmets 中提到的,我相信如果 A、B -- C、D 的置信率很高,那么 A -- C、D 和 B -- C、D也会有很高的置信度..即使这样我们还需要考虑第二条规则吗??
  • 如下所述,Manish 所说的并不成立。此外,A->CD 可以有更高的支持,因此仍然有用。假设您对 AB->CD 有 1% 的 szpport,那么如果适用于 99% 的数据,那么“较弱”的规则 A->CD 可能会非常有趣。

标签: database associations data-mining solver


【解决方案1】:

如果 A,b -- c,d 是一个关联规则,那么 A -- c,d 和 b -- c,d 显然会更有信心。所以我认为我们不需要考虑第二条规则。如果我的方法错误,请纠正我

【讨论】:

  • 否:如果我们有 5 次 ABCD,但只有 10 次 A,只有 10 次 B,那么 AB->CD 的置信度是 100% A->CD 有 20% 的置信度。此外,提升 != 信心。
猜你喜欢
  • 1970-01-01
  • 2018-02-15
  • 1970-01-01
  • 1970-01-01
  • 2015-12-26
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多