【发布时间】:2016-12-19 21:53:47
【问题描述】:
我想分析一下:在购物篮分析中哪些项目不顺利。基本上找出哪个项目一起没有出队列。我有一种情况,由于属性的各种组合,记录(包含 13 个属性/列)不完整。 例如: a1,a2 .... a13 。 以上所有属性可能有也可能没有值。但是任何没有值的属性都会导致记录不完整
在这种情况下,我需要查看哪些不完整记录的组合主要出现在我的记录集中。了解这种模式将有助于我的团队对最需要关注的记录进行优先排序。 我看到 Apriori 算法只采用可用的值,但我需要分析未发生的组合。我确信这个问题过去应该已经解决了,但我在论坛中没有看到任何提示。 有没有人有过这样的经历?还是您建议我应该使用任何其他算法?我正在使用 R 进行此分析。总记录:218k
【问题讨论】:
-
如果您需要帮助为您的数据选择合适的统计分析方法,那么您应该将您的问题发布到Cross Validated 或Data Science。这实际上不是一个特定的编程问题。您想使用 R 的事实与选择正确的数据分析方法无关。
标签: r analysis cross-validation apriori data-science