【问题标题】:how accurate is microsoft cognitive speaker identification微软认知说话人识别的准确性如何
【发布时间】:2020-08-24 08:48:33
【问题描述】:

我正在尝试使用 Microsoft Cognitive Speaker Identification Service 构建应用程序。但是当我使用它的 api 检查它时,一些音频无法正确识别。我想知道服务的准确度是多少。有什么办法可以改善吗?

【问题讨论】:

    标签: microsoft-cognitive


    【解决方案1】:

    有多种因素会影响识别的准确性,例如噪音水平、麦克风质量、回声等。

    为了在您的条件下提高性能,您可以确保在与测试音频相同的条件下录制注册音频(例如,相同的麦克风),并尽量确保在安静的环境中进行录制。

    【讨论】:

    • 感谢您的回答。我的问题与 Microsoft 认知服务的准确度有关。目前在测试过程中我发现它并不漂亮。在正面和负面条件下,它都会多次给出错误的结果。现在与环境有关,我正在测试在完全相同的环境中录制的不同声音样本。硬件也一样。只有用户在改变。
    【解决方案2】:

    它确实适用于多个用户,并在不同的 PC/麦克风上试用过。

    我会确保:

    • 它在一个安静的房间/环境中
    • 您正在正确发送音频...(它只是字节数组数据,没有额外的编码。) 还要检查标头 MediaTypeHeaderValue/content 类型,即使我们发送 wav 文件,所有请求似乎都是 'application/json'。
    • 在将用户映射到 azure guid 时要小心,并确保您使用的是正确的。如果您使用 SDK 而不是 API 来创建和注册配置文件,目前没有按 id 检索配置文件,我已经做了一个解决方法,重新创建配置文件,并在注册之前更新数据库中的 id。 (API 不需要这个)
    • 还要确保您使用的是最新的 API,(以 .../speaker/verification/v2.0/ 等结尾的 URL... V2 将配置文件存储在 3 个不同的位置,具体取决于验证方法。
    • 还要检查配置文件是使用您用来验证的相同验证方法创建/注册的。如果不确定,请尝试使用新的个人资料。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-06-19
      • 2020-06-16
      • 2017-06-08
      • 2020-03-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多