如何改进 Watson Speech to Text 演讲者标签

【问题标题】：How improve Watson Speech to Text speaker label如何改进 Watson Speech to Text 演讲者标签
【发布时间】：2018-09-12 06:24:02
【问题描述】：

我在我的项目中使用 Watson Speech to Text，但我有问题。

如何提高说话人标注的质量？
声学定制模型会影响这种改进吗？

请给我一些建议。

【问题讨论】：

**我的用例就像一个 4~10 人的小型会议，但在每次录音中，发言人总是在变化（总共超过 100 人）。我只需要在每次会议中确定 4~10 位发言者，而不需要长期确定所有（超过 100 位）发言者

标签： ibm-cloud ibm-watson speech-to-text

【解决方案1】：

声学模型定制只会对扬声器标签的质量产生中等影响。它应该会变得更好，但不要指望会有很大的改进。

您的扬声器标签有什么用例？您的录音中有多少个扬声器？

【讨论】：

感谢您的回答！我再次阅读了文档和参考资料，但在声学模型定制部分找不到有关扬声器标签的解释。我的用例就像一个 4~10 人的小型会议，但在每次录音中，发言人总是在变化（总共超过 100 人）。我只需要在每次会议中确定 4~10 位发言者，而不需要长期确定所有（超过 100 位）发言者。
扬声器标签功能通常在只有两个扬声器时效果更好……也就是说您可以尝试看看
好的，我明白了。我会尝试，如果我得到好的结果，会在这个社区发布。非常感谢。

猜你喜欢

1970-01-01
1970-01-01
1970-01-01
2017-07-28
1970-01-01
1970-01-01
2015-11-28
1970-01-01
1970-01-01

相关资源

下载 2022-11-30
下载 2022-12-28
下载 2023-02-14
下载 2021-06-05

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode