【发布时间】:2017-05-16 16:29:25
【问题描述】:
如果这个问题违反了 SO 的问题指南,我很抱歉,但我被困住了,我找不到其他地方可以问这类问题。假设我有一个数据集,其中包含在三种不同条件(热、冷、舒适)下获得的三个实验数据。数据在由 4 列 (time, cold, comfortable and hot) 组成的 pandas dataframe 中以三列排列。
当我绘制数据时,我可以直观地看到三个实验的分离,但我想用机器学习自动完成。
x 轴代表time,y 轴代表数据的magnitude。我已经阅读了不同的机器学习 classification techniques 但我不明白如何设置我的数据以便我可以将其“输入”到 classification 算法中。也就是说,我的问题是:
- 这在编程上可行吗?
- 如何设置(排列我的数据)以便可以轻松地将其输入到分类算法中? From what I read so far,看来,要使算法起作用,数据必须按特定顺序排列(例如,参见iris dataset,其中数据被很好地标记。如何自定义算法以满足我的需求?
注意:理想情况下,我希望程序在给定幅度值的情况下将其分类为
hot, comfortable or cold。在我的情况下,时间序列并没有太大的相关性
【问题讨论】:
-
您尝试使用分类来实现什么?如果是你的数据,你有其他数据作为测试集要分类吗?
-
为什么排序数据不够?好像你在这里遇到了一些 XY 问题meta.stackexchange.com/questions/66377/what-is-the-xy-problem
-
是的,可行,为什么不呢?您不需要任何预处理来使用您的数据,但行之间没有冲突,您可以使用一个简单的阈值来确定新数据
-
而且,一般来说,这类问题更适合Cross Validated。
-
ML用于非常复杂的数据,可以用ML,但是不值得,怎么可以MLP(多层感知器),但是需要很多前提。
标签: python scikit-learn