模式识别 - 难度答案

【问题标题】：Pattern recognition - difficulty模式识别 - 难度
【发布时间】：2016-03-02 22:54:29
【问题描述】：

我需要决定从哪个学期项目开始工作。我有机会从事 3D 空间中的实时模式识别工作，但我之前没有经验。我想问，在 3D 空间中实现可用的模式识别系统有多难。想象一下像 2 号图这样的东西，程序可以告诉它是 2 号——但是是 3D 和实时的。我会使用 Leap Motion，它为开发人员提供有关手指和手掌位置、速度、各种矢量等的大量数据，我想记录并检测各种手势（模式），如“竖起大拇指”、“和平标志” ”、“中指”等。问题是我不知道这有多难。

我在大学二年级 - 线性代数、数学分析、统计学和其他一些数学应该不成问题。我应该能够使用 c#、java、R、Prolog 和 Haskell 进行编程。

【问题讨论】：

标签： 3d gesture-recognition

【解决方案1】：

长话短说：2D 中强大的模式识别并非易事，尝试将其扩展到 3D 可能非常困难。该领域的许多问题仍未得到很好的解决。在任何情况下，您都需要尽可能缩小问题范围。

这是一个想法：尝试将场景分解为平面拟合、长方体和椭圆体。从那个分割中，也许使用“词袋”方法来建立对象之间的一些关系，尝试识别一些对象：沙滩球、白板等等。

另一种可能性是制作最强大的算法，可以在各种条件下跟踪形状独特的物体。例如，识别并计算房间中可乐瓶的数量。（这可能只在传感器的 1 - 2 米范围内起作用。）如果你改变照明，将可乐瓶移动到不同的房间，或者让某人拿着可乐瓶四处走动，你会很快发现这可能是一个棘手的问题。

我上次检查时，Leap 传感器不适合模式/形状识别，除非您的数据只是手和手指的位置。 Kinect v2 将为您提供原始 3D 数据以及用于骨骼跟踪、手势识别等的出色库。

只有几个月的时间来完成这样的任务，想出一个很酷的问题来解决是件好事，但要确保中间的解决方案至少在一定程度上有用。还要尽量提前定义公差、参数、识别率和其他细节——把它们写下来。这将对跟踪进度有很大帮助。

【讨论】：