【发布时间】:2015-12-01 09:43:27
【问题描述】:
我有以下类型的数据集(示例):
食物类型:中国、印度、泰国、墨西哥
成分1:盐、中盐
成分 2:辣椒、红辣椒、泰国辣椒、青辣椒
成分 3:姜黄、小豆蔻、
成分 4:鸡肉、牛肉、鱼、豆腐
我有一些手工制作的数据组合,我根据成分和食谱将它们分类为不同的食物类型。我需要根据最可能的组合生成更多数据。到目前为止,我所做的一种方法是生成所有成分的所有组合,然后根据之前的学习将它们分类为食物类型。但这种方法不实用,因为数据很大。每个类别的成分可以有超过 30-40 个值。此外,成分不仅仅是 4,它们在真实数据集中更多。我正在寻找比我已经提出的方法更好的方法来生成和分类数据。我已应用 NB 分类器对数据进行分类。非常感谢您的帮助
【问题讨论】:
标签: machine-learning classification combinations naivebayes