【发布时间】:2012-01-07 06:08:25
【问题描述】:
我希望记录与特定声音相对应的事件,例如关门声或烤面包机吐司。
系统需要比“大声噪声检测器”更复杂;它需要能够将特定声音与其他响亮的噪音区分开来。
识别不一定是零延迟,但处理器需要跟上来自始终开启的麦克风的连续传入数据流。
- 此任务是否与语音识别有显着不同,或者我可以使用语音识别库/工具包来识别这些非语音声音吗?
- 鉴于我只需要匹配一个声音(而不是在声音库之间进行匹配)的要求,我可以做一些特殊的优化吗?
This answer 表示 匹配过滤器 是合适的,但我对细节不清楚。由于目标声音的变化,我认为目标声音样本和麦克风流之间的音频波形数据的简单互相关不会有效。
我的问题也和this类似,没有引起太多关注。
【问题讨论】:
-
你在dsp.stackexchange.com 上可能会有更好的运气。
标签: java python real-time pattern-recognition audio-fingerprinting