【问题标题】:How improve Watson Speech to Text speaker label如何改进 Watson Speech to Text 演讲者标签
【发布时间】:2018-09-12 06:24:02
【问题描述】:

我在我的项目中使用 Watson Speech to Text,但我有问题。

  • 如何提高说话人标注的质量?

  • 声学定制模型会影响这种改进吗?

    请给我一些建议。

【问题讨论】:

  • **我的用例就像一个 4~10 人的小型会议,但在每次录音中,发言人总是在变化(总共超过 100 人)。我只需要在每次会议中确定 4~10 位发言者,而不需要长期确定所有(超过 100 位)发言者

标签: ibm-cloud ibm-watson speech-to-text


【解决方案1】:

声学模型定制只会对扬声器标签的质量产生中等影响。它应该会变得更好,但不要指望会有很大的改进。

您的扬声器标签有什么用例?您的录音中有多少个扬声器?

【讨论】:

  • 感谢您的回答!我再次阅读了文档和参考资料,但在声学模型定制部分找不到有关扬声器标签的解释。我的用例就像一个 4~10 人的小型会议,但在每次录音中,发言人总是在变化(总共超过 100 人)。我只需要在每次会议中确定 4~10 位发言者,而不需要长期确定所有(超过 100 位)发言者。
  • 扬声器标签功能通常在只有两个扬声器时效果更好……也就是说您可以尝试看看
  • 好的,我明白了。我会尝试,如果我得到好的结果,会在这个社区发布。非常感谢。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2017-07-28
  • 1970-01-01
  • 1970-01-01
  • 2015-11-28
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多