【问题标题】:Pattern recognition - difficulty模式识别 - 难度
【发布时间】:2016-03-02 22:54:29
【问题描述】:
我需要决定从哪个学期项目开始工作。我有机会从事 3D 空间中的实时模式识别工作,但我之前没有经验。我想问,在 3D 空间中实现可用的模式识别系统有多难。想象一下像 2 号图这样的东西,程序可以告诉它是 2 号——但是是 3D 和实时的。我会使用 Leap Motion,它为开发人员提供有关手指和手掌位置、速度、各种矢量等的大量数据,我想记录并检测各种手势(模式),如“竖起大拇指”、“和平标志” ”、“中指”等。
问题是我不知道这有多难。
我在大学二年级 - 线性代数、数学分析、统计学和其他一些数学应该不成问题。
我应该能够使用 c#、java、R、Prolog 和 Haskell 进行编程。
【问题讨论】:
标签:
3d
gesture-recognition
【解决方案1】:
长话短说:2D 中强大的模式识别并非易事,尝试将其扩展到 3D 可能非常困难。该领域的许多问题仍未得到很好的解决。在任何情况下,您都需要尽可能缩小问题范围。
这是一个想法:尝试将场景分解为平面拟合、长方体和椭圆体。从那个分割中,也许使用“词袋”方法来建立对象之间的一些关系,尝试识别一些对象:沙滩球、白板等等。
另一种可能性是制作最强大的算法,可以在各种条件下跟踪形状独特的物体。例如,识别并计算房间中可乐瓶的数量。 (这可能只在传感器的 1 - 2 米范围内起作用。)如果你改变照明,将可乐瓶移动到不同的房间,或者让某人拿着可乐瓶四处走动,你会很快发现这可能是一个棘手的问题。
我上次检查时,Leap 传感器不适合模式/形状识别,除非您的数据只是手和手指的位置。 Kinect v2 将为您提供原始 3D 数据以及用于骨骼跟踪、手势识别等的出色库。
只有几个月的时间来完成这样的任务,想出一个很酷的问题来解决是件好事,但要确保中间的解决方案至少在一定程度上有用。还要尽量提前定义公差、参数、识别率和其他细节——把它们写下来。这将对跟踪进度有很大帮助。