微软认知说话人识别的准确性如何答案

【问题标题】：how accurate is microsoft cognitive speaker identification微软认知说话人识别的准确性如何
【发布时间】：2020-08-24 08:48:33
【问题描述】：

我正在尝试使用 Microsoft Cognitive Speaker Identification Service 构建应用程序。但是当我使用它的 api 检查它时，一些音频无法正确识别。我想知道服务的准确度是多少。有什么办法可以改善吗？

【问题讨论】：

【解决方案1】：

有多种因素会影响识别的准确性，例如噪音水平、麦克风质量、回声等。

为了在您的条件下提高性能，您可以确保在与测试音频相同的条件下录制注册音频（例如，相同的麦克风），并尽量确保在安静的环境中进行录制。

【讨论】：

感谢您的回答。我的问题与 Microsoft 认知服务的准确度有关。目前在测试过程中我发现它并不漂亮。在正面和负面条件下，它都会多次给出错误的结果。现在与环境有关，我正在测试在完全相同的环境中录制的不同声音样本。硬件也一样。只有用户在改变。

【解决方案2】：

它确实适用于多个用户，并在不同的 PC/麦克风上试用过。

我会确保：

它在一个安静的房间/环境中
您正在正确发送音频...（它只是字节数组数据，没有额外的编码。）还要检查标头 MediaTypeHeaderValue/content 类型，即使我们发送 wav 文件，所有请求似乎都是 'application/json'。
在将用户映射到 azure guid 时要小心，并确保您使用的是正确的。如果您使用 SDK 而不是 API 来创建和注册配置文件，目前没有按 id 检索配置文件，我已经做了一个解决方法，重新创建配置文件，并在注册之前更新数据库中的 id。（API 不需要这个）
还要确保您使用的是最新的 API，（以 .../speaker/verification/v2.0/ 等结尾的 URL... V2 将配置文件存储在 3 个不同的位置，具体取决于验证方法。
还要检查配置文件是使用您用来验证的相同验证方法创建/注册的。如果不确定，请尝试使用新的个人资料。

【讨论】：