【发布时间】:2022-11-14 05:49:28
【问题描述】:
我正在一个为 IVR 收集用户语音输入的应用程序中工作。我们捕获的输入是一组有限的专有名词,但即使我们为所有可能的选项添加了提示,我们也经常得到难以理解的结果,这可能是因为我们的用户有来自各个部分的不同口音世界。我正在寻找一种方法来进一步改善语音识别结果,而不仅仅是使用提示。可用的 Google 自适应类不会有用,因为没有与我们正在收集的输入类型相匹配的类。我看到 Twilio 最近添加了一些名为 experimental_utterances 的东西,这可能会有所帮助,但我几乎找不到关于它的作用或如何实现的技术文档。
关于如何改进我们的语音识别结果的任何指导?
【问题讨论】: