【发布时间】:2016-08-01 12:48:14
【问题描述】:
我想为做fpGrowth和提取关联规则选择合适的数据集。我知道关系数据集和事务数据集适合这个任务,但我想知道一般什么样的数据集适合这个任务?
【问题讨论】:
我想为做fpGrowth和提取关联规则选择合适的数据集。我知道关系数据集和事务数据集适合这个任务,但我想知道一般什么样的数据集适合这个任务?
【问题讨论】:
您需要套装。不允许重复,没有顺序。
例如butter, milk, bread - 牛奶多少都无所谓。
此外,建议聚合产品类别而不是单个项目,即任何种类的牛奶都被认为是相同的。
【讨论】: