【问题标题】:Improving Twilio Speech Recognition of Proper Nouns改进专有名词的 Twilio 语音识别
【发布时间】:2022-11-14 05:49:28
【问题描述】:

我正在一个为 IVR 收集用户语音输入的应用程序中工作。我们捕获的输入是一组有限的专有名词,但即使我们为所有可能的选项添加了提示,我们也经常得到难以理解的结果,这可能是因为我们的用户有来自各个部分的不同口音世界。我正在寻找一种方法来进一步改善语音识别结果,而不仅仅是使用提示。可用的 Google 自适应类不会有用,因为没有与我们正在收集的输入类型相匹配的类。我看到 Twilio 最近添加了一些名为 experimental_utterances 的东西,这可能会有所帮助,但我几乎找不到关于它的作用或如何实现的技术文档。

关于如何改进我们的语音识别结果的任何指导?

【问题讨论】:

    标签: twilio speech ivr


    【解决方案1】:

    谷歌在识别专有名称方面做得不错,但不是实时的,只是异步的。我还没有看到可以实时执行此操作的 PaaS 工具。我建议你改变你的方法,也许可以根据 ANI 或帐号识别呼叫者,或者让他们记录他们的姓名以进行手动转录。

    大卫

    【讨论】:

    • 谢谢你的提示。不幸的是,它比这更复杂。我们捕捉的是他们的母语。我们需要正确识别它们所指示的语言,并从我们相当长的语言名称列表中选择它。由于各种原因,我们将需要继续捕获他们的口头输入,而不是他们输入一些数值来表示他们的母语。
    • 哦,男孩,你能根据来电显示缩小名单吗?因此,如果失败,请先执行 ASR。转到 DTMF,然后根据其他一些呼叫信息按您认为最有可能的语言?
    • 我希望这很容易。数千个 clientID 中的任何一个都可以调用数十种语言中的任何一种。在没有更好的选择的情况下,我倾向于使用提示来识别口语以进一步完善识别,即同时识别“Karen”和“Karenni”,而不仅仅是将 Karen 作为母语。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-04-19
    • 2010-10-11
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多