【问题标题】:Analyze voice patterns IOS分析语音模式 IOS
【发布时间】:2012-08-13 13:54:26
【问题描述】:

我正在寻找一种方法/库来分析语音模式。比如说,房间里有 6 个人。我想通过语音识别每一个。

非常感谢任何提示。

德米特里

【问题讨论】:

  • 您是否尝试过先在线搜索?
  • 首先,谷歌一下。 *.com/questions/8634366/… 的可能重复项
  • 这可能更适合姊妹 SE 站点 Signal Processing。 dsp.stackexchange.com
  • 是的,那些投票反对我的问题的人实际上并没有得到它。 @bitmapdata.com 我不是要识别单词,我只需要识别语音音色并进行区分。
  • @Hooked 感谢您将我指向该网站!

标签: ios audio speech-recognition


【解决方案1】:

在没有任何关于每个说话者语音特征的先验知识的情况下,将一段较长的连续录音分割成只有一个说话者在说话的块的任务称为“说话者分类”。你可以在wikipedia page找到研究代码的链接。

如果您之前对每个声音都有录音,并且更愿意进行分类,那么这是一个稍微不同的问题(说话人识别或说话人识别)。可以使用here 提供的软件工具(请注意,像 Sphinx 或 HTK 这样的通用语音识别包足够灵活,可以被哄骗去做)。

在这里回答https://dsp.stackexchange.com/questions/3119/library-to-differentiate-people-by-their-voice-timbre

【讨论】: