【问题标题】:Approach towards Mining Accelerometer Sensor Data加速度计传感器数据挖掘方法
【发布时间】:2015-06-02 17:54:51
【问题描述】:
我是数据挖掘的新手,对我在大学工作的一个项目有一些基本问题。
数据:我们决定从一组 21 个人(针对他们的不同活动,如步行、慢跑、跑步等)挖掘加速度计和陀螺仪传感器读数,并提出分类解决方案。
我的问题是:
由于读数属于连续数据(频率为 50 Hz 的数据),
我应该如何对数据进行采样。我会拿一个数据窗口吗?有没有沿着这条线的任何标准程序。
我应该使用什么样的模型来支持这种连续/顺序数据?隐马尔可夫模型是正确的方法吗?
一旦模型到达,它是否会再次将测试集中的一个窗口(或一系列)数据作为输入来预测活动?
【问题讨论】:
标签:
r
classification
data-mining
prediction
【解决方案2】:
您要问的是基本的数字信号处理问题,与数据挖掘没有太大关系。您应该阅读 DSP 简介,否则您将无法真正理解自己在做什么,并且每个人都可能正确地批评您的结果。
Biomed conference proceedings 中涉及振动关节造影,即基于多次振动测量的膝关节健康分类,因此您可能需要阅读现有文献。
由于读数属于连续数据(频率为 50 Hz 的数据),我应该如何对数据进行采样。我会拿一个数据窗口吗?有没有沿着这条线的任何标准程序。
是的,您可能必须选择部分数据。通常,您首先必须找到这些数据之间的时间对齐(通常最大相关性可以帮助您找到),或者您需要将此类数据转换为时不变的形式(傅立叶变换、功率谱密度等)。
您需要了解奈奎斯特极限是什么,并且您需要对信号理论有扎实的了解才能对数据做一些有用的事情。
我应该使用什么样的模型来支持这种连续/顺序数据?隐马尔可夫模型是正确的方法吗?
隐马尔可夫对于这个类的信号根本没有意义。找到一个好的分类器是一项困难的工作,您需要经验和大量的反复试验才能找到一个好的分类器。没有单一的正确方法,除非您可以在数学上准确地描述您的信号以证明存在最佳分类器。这将需要对您的信号如何“工作”有很多了解。
一旦模型到达,它是否会再次将测试集中的一个窗口(或一系列)数据作为输入来预测活动?
这取决于你想出的模型。
编辑:免责声明:我隶属于我在上面引用的那个项目,所以我可能有偏见。