使用python进行音频识别答案

【问题标题】：Audio Recognition using python使用python进行音频识别
【发布时间】：2022-01-19 02:59:58
【问题描述】：

我正在做一个小组项目。我们正在寻求开发一个程序，该程序可以通过笔记本电脑的麦克风接收音频，并将其与保存的音频文件进行比较，如果输入和保存的文件匹配，则输出音频消息。音频可以是演讲、音乐或歌曲。

我们想用某种 python 方法比较音频文件，但我们找不到任何方法来做到这一点。我们正在寻找某种库，以便能够从每个文件中获取数据并查看它们是否相似。

我们看了很多教程，在网上搜索过，但仍然需要一些重要的帮助。有人可以向我们解释如何开始吗？

【问题讨论】：

看看这个repo
如果你正在尝试制作类似于 Shazam 的东西，那么我建议你看看 audio-fingerprint-identifying-python repo
请通过intro tour、help center 和how to ask a good question 了解本网站的运作方式并帮助您改进当前和未来的问题，从而帮助您获得更好的答案。 “告诉我如何解决这个编码问题？”与 Stack Overflow 无关。您必须诚实地尝试解决方案，然后就您的实施提出具体问题。
同时检查can someone help me?。这表明 Stack Overflow 的一系列需求过于广泛。这是一个完全有效的地方，但它超出了 Stack Overflow 的范围。

【解决方案1】：

尝试使用两个音频文件的 python 将音频转换为频谱图并比较两个图像，而不是比较音频。你可以得到最好的结果。

但是如果你只想处理音频文件是的，有一些库可以使用。

1. Librosa - Python library for audio and music analysis

link 代表 Librosa

【讨论】：

【解决方案2】：

试试 dejavu 项目，真的很有帮助。它基于 Numpy。

【讨论】：

【解决方案3】：

但是，如果您只是想过滤音频文件，是的，您可以使用一些 python 库。这是一个链接；

或者使用 pip install SpeechRecognition 安装

希望这能解决您的问题。

【讨论】：