【问题标题】:Search for instances of a sound bite in an audio file在音频文件中搜索声音片段的实例
【发布时间】:2011-03-28 23:05:32
【问题描述】:

我有两个音频文件。一个持续大约一秒钟,包含非常无聊的“哔”声,另一个持续大约 60 分钟,充满随机声音(谈话、噪音等)以及相同的“哔”噪声实例(注意: “哔”声可能与其他声音同时出现!)。

谁能向我建议一种简单的方法来编写一个搜索 60 分钟音频文件的程序,并为它找到的每个“哔”噪声实例返回一个时间戳?我一直在寻找如何做到这一点,但我什至无法弄清楚要搜索/阅读哪些术语。

如果可能,我更愿意使用 Python,但我也愿意使用 C、C++、Java 或(对我来说最明显的)Matlab。请随意向我指出教科书、概念或任何您认为可能有帮助的东西。我愿意做大量的学习来弄清楚如何做到这一点。非常感谢任何帮助!

编辑:为了清楚起见标题

【问题讨论】:

  • 作为参考,声音几乎总是远远超过一个字节。您的意思可能是“声音片段”,它是一种短音。

标签: audio


【解决方案1】:

我想您必须将信号转换为频域(FFT),然后从头到尾读取声音,并搜索您想要的频率超过某个阈值的地方,然后查看它是否重复至少一秒钟。希望您的哔声足够响亮,以便可以将阈值设置得足够高,并且声音不会与“背景”噪音和声音混淆。

【讨论】:

    【解决方案2】:

    您正在寻找的技术称为音频指纹识别。 在this answer 中有描述。

    【讨论】:

      【解决方案3】:

      首先你要明白,你想做的事情并不是一件容易的事。这就像赋予计算机聆听和匹配声音的能力。使其更能以人类感知的方式感知声音。您可以浏览某些开源项目以寻求帮助。查找与该主题密切相关的一些开源项目的 AcoustID 和 chromaprint。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2012-02-15
        • 1970-01-01
        相关资源
        最近更新 更多