【问题标题】:Audio Recognition using python使用python进行音频识别
【发布时间】:2022-01-19 02:59:58
【问题描述】:

我正在做一个小组项目。我们正在寻求开发一个程序,该程序可以通过笔记本电脑的麦克风接收音频,并将其与保存的音频文件进行比较,如果输入和保存的文件匹配,则输出音频消息。音频可以是演讲、音乐或歌曲。

我们想用某种 python 方法比较音频文件,但我们找不到任何方法来做到这一点。我们正在寻找某种库,以便能够从每个文件中获取数据并查看它们是否相似。

我们看了很多教程,在网上搜索过,但仍然需要一些重要的帮助。有人可以向我们解释如何开始吗?

【问题讨论】:

  • 看看这个repo
  • 如果你正在尝试制作类似于 Shazam 的东西,那么我建议你看看 audio-fingerprint-identifying-python repo
  • 请通过intro tourhelp centerhow to ask a good question 了解本网站的运作方式并帮助您改进当前和未来的问题,从而帮助您获得更好的答案。 “告诉我如何解决这个编码问题?”与 Stack Overflow 无关。您必须诚实地尝试解决方案,然后就您的实施提出具体问题。
  • 同时检查can someone help me?。这表明 Stack Overflow 的一系列需求过于广泛。这是一个完全有效的地方,但它超出了 Stack Overflow 的范围。

标签: python fingerprint audio-fingerprinting


【解决方案1】:

尝试使用两个音频文件的 python 将音频转换为频谱图并比较两个图像,而不是比较音频。你可以得到最好的结果。

但是如果你只想处理音频文件是的,有一些库可以使用。

1. Librosa - Python library for audio and music analysis 

link 代表 Librosa

【讨论】:

    【解决方案2】:

    试试 dejavu 项目,真的很有帮助。它基于 Numpy。

    【讨论】:

    • 欢迎堆栈溢出!请添加指向外部项目和资源的链接。谢谢!
    【解决方案3】:

    但是,如果您只是想过滤音频文件,是的,您可以使用一些 python 库。 这是一个链接;

    https://pypi.org/project/SpeechRecognition/

    或者使用 pip install SpeechRecognition 安装

    希望这能解决您的问题。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-02-07
      • 2018-01-27
      • 2019-05-05
      • 2018-10-17
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多