改进专有名词的 Twilio 语音识别答案

【问题标题】：Improving Twilio Speech Recognition of Proper Nouns改进专有名词的 Twilio 语音识别
【发布时间】：2022-11-14 05:49:28
【问题描述】：

我正在一个为 IVR 收集用户语音输入的应用程序中工作。我们捕获的输入是一组有限的专有名词，但即使我们为所有可能的选项添加了提示，我们也经常得到难以理解的结果，这可能是因为我们的用户有来自各个部分的不同口音世界。我正在寻找一种方法来进一步改善语音识别结果，而不仅仅是使用提示。可用的 Google 自适应类不会有用，因为没有与我们正在收集的输入类型相匹配的类。我看到 Twilio 最近添加了一些名为 experimental_utterances 的东西，这可能会有所帮助，但我几乎找不到关于它的作用或如何实现的技术文档。

关于如何改进我们的语音识别结果的任何指导？

【问题讨论】：

标签： twilio speech ivr

【解决方案1】：

谷歌在识别专有名称方面做得不错，但不是实时的，只是异步的。我还没有看到可以实时执行此操作的 PaaS 工具。我建议你改变你的方法，也许可以根据 ANI 或帐号识别呼叫者，或者让他们记录他们的姓名以进行手动转录。

大卫

【讨论】：

谢谢你的提示。不幸的是，它比这更复杂。我们捕捉的是他们的母语。我们需要正确识别它们所指示的语言，并从我们相当长的语言名称列表中选择它。由于各种原因，我们将需要继续捕获他们的口头输入，而不是他们输入一些数值来表示他们的母语。
哦，男孩，你能根据来电显示缩小名单吗？因此，如果失败，请先执行 ASR。转到 DTMF，然后根据其他一些呼叫信息按您认为最有可能的语言？
我希望这很容易。数千个 clientID 中的任何一个都可以调用数十种语言中的任何一种。在没有更好的选择的情况下，我倾向于使用提示来识别口语以进一步完善识别，即同时识别“Karen”和“Karenni”，而不仅仅是将 Karen 作为母语。