voice

安卓语音输入,无需点击

我是安卓开发新手。我需要为我正在开发的新应用程序提供一个解决方案,该应用程序接受语音输入并通过与映射数据库进行映射来提供语音输出。当前程序通过 onlick 按钮进行语音输入。我需要一个可以在不点击任何与会说话的汤姆应用程序类似的按钮的情况下进行语音输入的灵魂。这是我的代码。我的主要代码在 speakToMe 中,这是 onclick 和 onActivityResult 调用的方法 packa... »

是否可以在调用客户端而不是数字时控制 callerid 输出?

在拨打电话号码时使用 Twilio,必须将有效的电话号码作为呼叫者 ID。但是,在呼叫移动客户端时,呼叫者 ID 的文档很少。 The Twml docs for callerid says: 如果您拨打的是<Client>,您还可以设置一个有效的客户端 作为 callerId 属性的标识符。例如,如果您设置了一个 来电的客户端并且您正在拨打该客户端,您可以 将 callerId 属... »

语音识别 - 我应该如何使用模型对给定的音频流进行分类?

我不是音频专家,但语音识别是我真正想探索的领域之一。 我一直在关注 tensorflow wiki 关于这个问题。 https://www.tensorflow.org/tutorials/audio/simple_audio 为了创建一个模型,我使用了我和一些朋友的个人录音。我注意到该模型只能接收大小为 31.2kb(format.wav) 的音频样本 在训练完这个模型后,我成功地把它和类一起保... »

声音没有在声音播放android程序中播放

在这个程序中,我们可以通过按钮播放 15 个 mp3 文件。 我在“youwave for android”中模拟程序,效果很好。 当我在 lenovo ideatab a3000 平板电脑和 xperia z1 手机上进行测试时,有时当我们从一个按钮切换到另一个按钮时,它不会播放声音,如果我们再次按下按钮,它也不会播放。 我们应该按下其他按钮并回到没有播放声音的按钮播放声音。 我检查了这些按钮的... »

Python 谷歌语音

我正在使用来自here 的谷歌语音 API,并尝试从 Python 发送短信。但是,每当我尝试使用此代码登录时,都会得到一些我没想到的东西: from googlevoice import tests from googlevoice import Voice from googlevoice.util import input def login(): username, passw... »

Android 通话录音下行链路静音

我正在尝试使用 Android 录制上行链路和下行链路语音。不管法律什么的,我已经知道了,所以请不要把与法律有关的cmets。 下面的代码可以正常工作,除了当我将麦克风静音时,它不会记录下行语音。 我使用的是 Android 8.1。我试过在同一台设备上使用名为 ACR 的第三方应用程序,它工作正常,当我静音时,它仍然记录下行链路的声音。 val audioManager = applic... »

使用用户语音唤醒并启动应用程序 [关闭]

我正在开发我想使用语音命令打开和启动应用程序的应用程序是否可以在应用程序关闭时跟踪用户音频并通过用户语音命令打开它(一些特定的词,如你好应用程序名称) .... »

一分钟后,Twilio 通话意外掉线

我正在使用 Twilio Studio 创建调查,我的问题是每当流量到达“记录”或“收集”小部件时,如果记录时间超过一分钟,通话就会意外结束。我将“MAX RECORDING LENGTH”设置为 180。我检查了通话记录,“Record”小部件没有警告,“Gather”小部件显示以下警告: 消息“phone_call 模型必须有正的 SpeechTimeout。回退到具有 SpeechTimeo... »

使用 SpeechRecognition 更改语音合成语音

我正在通过麦克风使用 SpeechRecognition,并通过 SpeechSynthesis 将数据转发给我。 我在页面加载时将声音设置为女性声音,并希望能够通过说“男性声音”切换为男性声音,然后转播“我现在是男性”。我后来也希望能够做相反的事情 - 当它设置为男性声音时,说“女性声音”然后它会切换回来。 我目前可以这样做,但男声只会说一次,因为声音没有被保存,只是作为参数传递。因此,接下... »

有没有人成功使用 CMU Sphinx 进行语音识别编程

我想开始通过语音识别软件进行一些编码(可能是我所做工作的 10-20%)。 我看到有些人使用 Dragon Natural Speech (DNS) 软件取得了成功,但我使用的是 Mac,不幸的是,Dragon 只能在 Windows 上运行。 有人使用 Carnegie Melon 开源 Sphinx http://cmusphinx.sourceforge.net/ 进行编程吗? 还有... »

录制语音并将其保存为 mp3 文件

是否可以使用麦克风录制(5 秒)声音并将其保存为 mp3 文件而不向服务器发送数据?我想用 FileReference 保存文件(前段时间我做了一个保存位图的实验,它成功了)。... »

有没有办法使用 Alexa 或 DialogFlow.ai 等技术来使用原始音频数据?

我正在开发一个使用语音识别来帮助盲人学习音乐的应用程序。为此,我正在考虑使用 DialogFlow.ai,甚至是 Amazon Alexa,以免重蹈覆辙。因此,有时我想使用原始音频数据来检查乐器是否经过调音。使用这些技术,默认情况下,所有音频输入都会被解释并因此转换为文本。那么,有没有办法使用原始音频数据而不是解释用户语音?... »

python语音签名识别?

我正在开发一个系统,该系统会锁定我的计算机中的多个部分,并且只能使用我的声音说出特定的内容来打开它们 单词(在 python 中)。我已经制作了一个系统,可以锁定我电脑中的部件,直到你给它密码,但我想把它改成语音。 我确实在网上找到了一些语音处理,但它真的很复杂而且没有解释 在蟒蛇。 我知道 python 可能不是这样做的正确语言,但我想尝试一下! 感谢您的帮助!... »

使用 twilio 生成语音通话

我使用 twilio api 开发了一个小型应用程序,可以从我的 twilio 号码拨打任何电话号码。拨号后通话正在建立,移动端正在播放特定的音频片段。但我在电话的任何一方都没有听到任何真实的声音。请帮助我或给我一些有关如何使用 twilio api 在语音通话中获得语音的信息。 谢谢, 塔尼姆 代码sn-p: $client = new Services_Twilio($AccountSid... »

Chrome:不“记住”允许访问麦克风的选择

我有一个超级简单的网页,它使用Web Speech API,这样我就可以更轻松地与妈妈交流(她是聋子)。 Google 的语音识别速度足够快,我可以与她实时交谈(她会读取 VR 结果)。 我的网站:http://goo.gl/Wm69Mp 我们都在使用 Chrome v30.0.1599.66。 我遇到的问题是,每次我点击麦克风图标时,Chrome 都会询问我是否要允许访问。 我每次都... »

Android 中的离线语音识别

我在 StackOverFlow 上搜索了很多有关此问题的信息,但线程已超过 3 年。 我实现了需要 Internet 连接的 Google Voice Recognition。搜索我如何使用Offline Voice Recognition 没有成功。 现在可以在离线时使用Voice Recognition 吗? 到目前为止我的代码: speechStartButton.setOnCli... »

当 Alexa 技能作为 Web 服务托管时用于发回 JSON 响应的 URL

我拥有一项托管在 AWS 中的技能(目前处于开发阶段)。我想将它移动到本地机器而不是使用 lambda 函数。我编写了一个 API,用 ngrok 公开它,并将它配置为技能的端点。我能够从 Alexa 技能接收请求 JSON 对象。但我不确定将响应 JSON 发送到哪个 URL 或 API。 我在请求 JSON 中收到了 apiEndpoint 和 apiAccessToken。我尝试将 JS... »