【发布时间】:2018-10-14 11:20:17
【问题描述】:
我们还需要一种识别 DTMF 的可能性。 设想: 在电话交谈中,我们询问用户“请输入身份证号”。 我们将音频流式传输到谷歌云语音到文本。 我们希望同时支持这两个选项:(a) 用户说 id nubmer (b) 用户使用电话键 (DTMf) 按下 id 号码。
【问题讨论】:
我们还需要一种识别 DTMF 的可能性。 设想: 在电话交谈中,我们询问用户“请输入身份证号”。 我们将音频流式传输到谷歌云语音到文本。 我们希望同时支持这两个选项:(a) 用户说 id nubmer (b) 用户使用电话键 (DTMf) 按下 id 号码。
【问题讨论】:
似乎无法使用 Cloud Speech-to-Text 检测到 DTMF。我代表您打开了public issue 请求此功能。您可以为问题加注星标并关注进度。
作为一种解决方法,您可以使用scipy.signal 库的spectogram 方法来检测唯一的DTMF frequencies。
【讨论】: