【问题标题】:Deciding the minimum support threshold for the frequent itemset generation in apriori algorithmapriori算法中确定频繁项集生成的最小支持阈值
【发布时间】:2020-02-14 01:38:31
【问题描述】:

我想找到 apriori 算法的最小支持阈值。我知道它完全依赖于用户和数据集,但我找到了一篇使用指数衰减函数的文章。 http://data-mining.philippe-fournier-viger.com/how-to-auto-adjust-the-minimum-support-threshold-according-to-the-data-size/ 这是根据先验算法导出公式的链接。我想知道如何确定常量 'a'、'b' 的值,因为它们也可能因用户而异。 'c' 也被认为是最小可能的支持。我使用内置的python mlxtend 包来生成频繁项集,其中min_support 作为输入之一。那么,在使用apriori 方法之前,我们如何决定“c”,从而产生尽可能小的支持

【问题讨论】:

    标签: python data-mining apriori


    【解决方案1】:

    必须选择 a、b 和 c 并不比必须选择刚刚超过参数更好...

    我认为这个等式是为了随着数据集的增长而随着时间的推移调整参数。但是您似乎已经找到了多个合适的参数来计算 a 和 b。

    【讨论】:

      猜你喜欢
      • 2016-09-18
      • 1970-01-01
      • 2017-08-10
      • 2012-12-20
      • 1970-01-01
      • 2016-09-19
      • 2012-05-09
      • 2021-05-24
      • 2019-09-04
      相关资源
      最近更新 更多