【发布时间】:2016-08-07 13:04:07
【问题描述】:
有没有人知道一个库、程序、项目等试图确定音频文件中有多少说话者处于活动状态、标记每个说话者、标记其性别等?
到目前为止,我发现了以下内容:
【问题讨论】:
-
你检查过
Project Oxford-Microsoft Cognitive Services的一部分 - 他们已经产生了Emotion和Speaker Recognitionsdk 等。这可能会让你开始。 -
谢谢@brandall。这是一个很好的检查资源:)
-
@Aley 请告诉你什么对你有用。我尝试了 pyaudioanalysis,但它在区分女性和女性时惨遭失败。
-
没发现什么好东西:(