【发布时间】:2011-06-01 16:24:28
【问题描述】:
我希望能够识别 iOS 应用程序中的特定声音。我想它基本上会像语音识别一样工作,因为它相当模糊,但它只需要针对 1 个特定的声音。
我已经完成了一些快速 FFT 的工作来识别超过特定阈值的特定频率,并且仅当它们是独奏时(即,它们没有被其他频率包围),所以我可以很容易地识别单个音调。我认为这只是对此的扩展,但与声音记录的 FFT 数据集进行比较,并比较音频长度上的 0.1 秒块。而且我还必须考虑幅度变化、音高变化和时间变化。
谁能指出我可以用来加速这个过程的任何预先存在的来源?我似乎找不到任何可用的东西。或者失败了,关于如何开始这样的事情的任何想法?
非常感谢
【问题讨论】:
-
您找到解决方案了吗?我正在尝试做类似的事情 - 在两个设备之间传输数据,使用音频来表示数据,所以我只需要识别由两个设备上已经存在的文件生成的特定声音....