【发布时间】:2016-12-20 20:53:38
【问题描述】:
我是机器学习及其技术的初学者。
我需要有关构建模型的建议。这是问题陈述 -
我有一个拥有特定公司 X 的所有产品(4 种产品)的客户数据集 - 将此集称为 Cust4。
我还有另一个数据集仅拥有同一公司 X 的少量产品(3 种产品)的客户 - 将此集合称为 Cust3。
我已经为这两个数据集收集了许多“分类”和“数字”属性(有不是文本数据)。
我想向拥有 3 种产品的客户销售更多产品(我想向他们销售第 4 种产品),因此想知道如何类似
是 Cust3 客户将他们与 Cust4 客户集进行比较,因此我只向与 Cust4 集中的客户高度相似的客户销售。
是否有一种技术/什么技术适合告诉我,例如 Cust3 集中的特定测试客户与 Cust4 集有 70% 相似或 80% 相似等?
到目前为止的研究 -
我试图将其定义为一类分类问题,并研究了一类分类,尤其是一类 SVM(在 R 中)。
这确实建立了一个模型并对数据进行分类,但目前不支持概率预测(R 包 e1071)。
了解可能适用于此类问题的其他技术会有所帮助。感谢所有帮助。
【问题讨论】:
标签: machine-learning svm similarity