【发布时间】:2019-05-20 11:34:04
【问题描述】:
我的一位同事要求我解决一个问题,我很难想出可能的解决方案。问题是: 我有一个数据集,其中每一行代表我们在这里制造的一件产品,而列代表在生产过程中出现的许多不同因素的值(例如长度、重量、温度等)。现在,有时会出现某种产品严重缺陷,无法出售给客户。由于我们不知道为什么会出现这些缺陷,我们想查看这个数据集并使用 R 中的机器学习算法找出有缺陷的产品是否有任何不同或异常(例如温度高于平均水平等)开)。
我想我要问的是,如果有任何类型的方法、算法或研究,任何人都可以指出我,这样我就可以获得更多有关这方面的信息。 非常感谢您的帮助!
【问题讨论】:
-
查看随机森林/决策树。设置计算只需要您做一些工作。
标签: r machine-learning data-science