【发布时间】:2016-09-19 19:31:10
【问题描述】:
我使用 Apriori 算法,当我使用 min support= 2 时,得到以下项集作为频繁项集。(项集:支持) 我对此实施的目标是根据客户识别的频繁项目集和他已经添加到购物车的内容向客户提出建议
-+- L -+-
[5] : 3
[1] : 3
[2] : 3
[3] : 4
-+- L -+-
[1, 2] : 2
[1, 5] : 2
[3, 5] : 3
[1, 3] : 3
[2, 5] : 3
[2, 3] : 3
-+- L -+-
[1, 2, 5] : 2
[1, 2, 3] : 2
[2, 3, 5] : 3
[1, 3, 5] : 2
-+- L -+-
[1, 2, 3, 5] : 2
我的第一个问题是:我只使用支持规则来识别上述集合。在什么时候我应该使用信心和提升规则?是在识别频繁项集时,还是在根据已识别的频繁项集添加推荐时?
我的第二个问题是:我在添加推荐时使用了置信度规则,我应该如何检查置信度规则? 例如,如果用户将第 2,5 项添加到他的购物清单中,我建议也购买第 3 项。基于 [2,3,5] 集。推荐第 3 项的规则应该如何?即[2,5]的频率应该更接近[2,3,5]的频率或[3]的频率应该更接近[2,3,5]的频率?
在建议第 3 项之前我必须检查哪些条件?
我的第三个问题是提升规则在哪些情况下很重要?根据上面的项目集,即使我考虑了所有支持、信心和提升规则,似乎也可以建议任何项目。如果我错了,请纠正我?
谢谢
【问题讨论】:
标签: algorithm data-mining apriori