【发布时间】:2020-02-14 01:38:31
【问题描述】:
我想找到 apriori 算法的最小支持阈值。我知道它完全依赖于用户和数据集,但我找到了一篇使用指数衰减函数的文章。
http://data-mining.philippe-fournier-viger.com/how-to-auto-adjust-the-minimum-support-threshold-according-to-the-data-size/
这是根据先验算法导出公式的链接。我想知道如何确定常量 'a'、'b' 的值,因为它们也可能因用户而异。 'c' 也被认为是最小可能的支持。我使用内置的python mlxtend 包来生成频繁项集,其中min_support 作为输入之一。那么,在使用apriori 方法之前,我们如何决定“c”,从而产生尽可能小的支持
【问题讨论】:
标签: python data-mining apriori