【问题标题】:Is there a way to use the raw audio data using technologies as Alexa or DialogFlow.ai?有没有办法使用 Alexa 或 DialogFlow.ai 等技术来使用原始音频数据?
【发布时间】:2023-09-22 22:47:01
【问题描述】:
我正在开发一个使用语音识别来帮助盲人学习音乐的应用程序。为此,我正在考虑使用 DialogFlow.ai,甚至是 Amazon Alexa,以免重蹈覆辙。因此,有时我想使用原始音频数据来检查乐器是否经过调音。使用这些技术,默认情况下,所有音频输入都会被解释并因此转换为文本。那么,有没有办法使用原始音频数据而不是解释用户语音?
【问题讨论】:
标签:
speech-recognition
alexa
web-audio-api
speech-to-text
voice-recognition
【解决方案1】:
出于多种原因(主要是安全性),Amazon Alexa 和其他类似技术不允许您获取用户的原始输入。使用 Amazon Alexa 作为一种捕获乐器音频输入的方法并不是实现调谐器的合理方法。您应该实现自己的方式来捕获音频,并可能将其与 Alexa/DialogFlow 结合使用以进行命令解释。