【问题标题】:Emotion detection in speech语音中的情绪检测
【发布时间】:2013-06-04 00:31:18
【问题描述】:

我想构建一个应用程序来分析麦克风语音的情感内容。

虽然有时用作额外功能,但这并不涉及语音识别。情绪分析基于声音的韵律特征(音高变化、速度等、音调)。

我知道这可以在台式计算机上完成,但我不希望用户必须将他们的录音(电话对话)上传到服务器才能获得情感反馈。

我需要的是一个 API,它可以提供整个分析,或者一个我可以用来提取这些特征的 API(即对话的平均速度)。

那里有这样的东西吗?

提前致谢!

【问题讨论】:

    标签: android speech-recognition speech


    【解决方案1】:

    检查这个 OpenEAR 包,它应该提供最新状态的所有内容

    http://sourceforge.net/projects/openart/

    在这里阅读

    http://www.mmk.ei.tum.de/publ/pdf/09/09eyb1.pdf

    慕尼黑 openEAR 工具包是用于自动语音情感识别的完整软件包。它的首字母缩写词代表开放的情感和情感识别工具包。它基于openSMILE特征提取器,因此能够实时在线情感识别。包括在各种标准语料库上的预训练模型,以及用于快速构建和评估自定义模型集的脚本和工具。当前包含的分类器是使用 LibSVM 库的支持向量机。即将推出的还有双向长短期记忆递归神经网络、判别多项式贝叶斯网络和惰性学习器。

    openEAR 是根据 GPL 许可获得许可的免费软件。第一个版本(包括模型集和预编译的 openSMILE)将很快在 Sourceforge:openEAR 上发布。同时,请参考我们提供特征提取引擎的openSMILE项目。

    【讨论】:

    • 非常感谢会调查这个!
    • Nikolay,所以如果我没记错的话,如果我想将音频文件归类为 6 种基本情绪类型之一(因为它是在柏林数据库上训练的),则不涉及训练阶段)?还是我需要实现分类器?但是分类器应该被训练对吗?如果我问的是显而易见的,请原谅。感谢您的帮助
    • 提供预训练模型,无需训练即可使用,仅用于情绪检测。提供了分类器,您可以根据需要进行修改。您还可以在自己的数据库上训练新模型。
    • 好的,谢谢!由于我无法获得带注释的数据,因此无法进行培训。但这会很好,我希望;)
    猜你喜欢
    • 2023-03-19
    • 2015-03-12
    • 1970-01-01
    • 2022-10-15
    • 1970-01-01
    • 1970-01-01
    • 2013-03-23
    • 2012-07-26
    • 1970-01-01
    相关资源
    最近更新 更多