【问题标题】:SpeakerRecognition - Identifying more than one speaker in an audio - C#SpeakerRecognition - 识别音频中的多个扬声器 - C#
【发布时间】:2019-01-31 07:24:54
【问题描述】:

使用 SpeakerRecognitionAPI,我已成功注册并识别扬声器。现在,我有多个用户在一个音频中讲话,如何从音频中识别多个用户?自 5 小时以来,我一直在搜索,但找不到任何东西。任何帮助将不胜感激。谢谢。我正在研究 .net MVC 结构。

【问题讨论】:

    标签: c# asp.net-mvc azure microsoft-cognitive


    【解决方案1】:

    你只需要像第一个一样注册你的用户,然后查询Speaker Recognition部分API的Identification方法,传入识别配置文件的ID

    在此处查看 API 方法: https://westus.dev.cognitive.microsoft.com/docs/services/563309b6778daf02acc0a508/operations/5645c523778daf217c292592

    小心,您只能限制 10 个 Id...

    【讨论】:

    • 是否可以在同一个 wav 音频中追踪两个不同的扬声器?
    • 另外,能否通过nuget包Microsoft.ProjectOxford.SpeakerRecognition实现
    【解决方案2】:

    所以,经过深入研究。您必须发送以逗号分隔的识别配置文件 ID,以便找出音频中的配置文件,但现在不支持分类。转向谷歌语音 api,因为它提供了该功能。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-07-26
      • 1970-01-01
      • 1970-01-01
      • 2015-04-20
      • 1970-01-01
      相关资源
      最近更新 更多