【发布时间】:2017-06-28 07:55:40
【问题描述】:
我想根据他们的历史购物篮对客户进行聚类。
我有以下矩阵来描述每个用户及其相应的购买产品数量。例如。用户1购买了productA 0个,productB 5个,productC 6个
用户ID、产品A、产品B、产品C
1、0、5、6
2、1、4、5
3,9,1,0
我想做的事:
根据客户购买的产品(客户 1 和 2 非常相似,因为两者都购买了大量的产品 B 和 产品C,而客户3更喜欢产品A)
可视化集群
问题:
- 我有大约 200.000 名客户
- 我有大约 50.000 种产品(可以组合成 示例类别 -> 仍将超过 150 个类别/a.k.a 尺寸
有没有推荐的方法在 Python 中做这些事情?
【问题讨论】:
-
也许可以查看
scikitscikit-learn.org/stable/modules/clustering.html。或者pypi.python.org/pypi/cluster/1.1.0b1“python-cluster 是一个“简单”的包,允许从列表中创建多个对象组(集群)”