【问题标题】:Google speech to text api android谷歌语音到文本 api android
【发布时间】:2018-09-19 05:51:47
【问题描述】:

Android google Speech to text SDK,录音由 SDK 控制。 我需要将其设置为手动按钮,用于开始和停止语音到文本的语音录制。例如:当点击一个按钮开始语音识别时,它会继续录制音频,直到点击停止按钮。但在 android SDK 中,它会自动停止录制并将录制的音频传递给处理。

【问题讨论】:

  • 请编辑您的问题并发布您的尝试。

标签: android google-speech-api


【解决方案1】:

我创建了带有 Start 和 Stop 的 Android 示例应用程序的更新版本,并将其发布在此处:

https://github.com/Avilaaiops/SpeechRecognitionClient

它将 Gradle 更新到 4.0.1,将 Kotlin 更新到 1.3.72,并将 Speech SDK 更新到 1.24.0

这应该有助于人们寻找不再包含在 alpha SDK 上的最新示例。

【讨论】:

    【解决方案2】:

    据我所知,这就是它的工作方式。没有连续的语音识别。要实现您要求的功能,您需要使用第三方库,例如 thisthis 之一。

    【讨论】:

    • 这个库也会自动停止录制,并开始翻译。目前我正在使用开始和停止按钮手动录制音频,然后使用该音频调用 google api,如果它的大小大于 api 约束,那么我将其拆分为小数据包并单独调用 api,然后连接生成的数据。但这不是最好的解决方案,Microsoft azure Intent 语音服务也有一些这样的功能。
    【解决方案3】:

    目前还没有关于如何在 Android 中从流式输入中转录音频的官方文档,但 Java、C#、Go、Python 和 Node.JS 除外。但是,API 有一个示例 Android app。您可以以此为起点,将Java code 转换为Android Native 代码。

    注意:尽管 Android 使用 Java,但它是一个不同的版本,旨在适应 Android 架构。

    使用我上面提到的方法需要额外的努力、研究技能以及 Java 和 Android 基础编程技能。 #thisisthehardway

    更简单的方法是应用外部库,如 Droid Speech(如 @kAliert 所述)。

    来自 Droid Speech 的文档:

    Droid Speech 旨在缩小这一差距并提供无与伦比的 没有上述任何一项的连续语音识别的优化 说的问题。它的开发牢记所有漏洞 需要阻止以使语音识别无缝运行 安卓设备。

    这相对容易,但它是由第三方制作的,因为您无法完全控制它。

    干杯!

    【讨论】:

      【解决方案4】:

      为此,我进行了很多搜索,但没有找到任何实现 Microsoft 语音转文本 api 的解决方案。最后我得到了对我有用的解决方案,希望我能为你工作,或者它可以帮助正在搜索的人。我只是提到了 git 存储库链接,Pickup the MainActivity.java,gradle(aap and project level) ,布局 xml 并放入您的项目中。执行并享受解决方案。

      Git 存储库链接是MircoSoftSpeechToText

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2020-04-29
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多