【问题标题】:Python audio wav file analysisPython音频wav文件分析
【发布时间】:2017-02-08 21:40:40
【问题描述】:

我正在开发一个程序,该程序需要 30 分钟的 wav 文件并针对各种事件对其进行分析。我有一堆 30 分钟的体育赛事 wav 文件,并试图以一种自动化方式来查找某些事件发生的时间。

例如,以下是我希望尝试识别的事件: - 当一个目标或事件发生时,人群中会发出噪音和欢呼声。我想返回这些事件发生的时间。 - 或者当哨声响起时 - 还能够识别长时间的完全沉默会有所帮助

我一直在尝试绘制这些音频样本的 FFT,并得出结论,这并不能让我对这些事件有最好的了解。最好的流程是什么?

任何指导将不胜感激。

谢谢

【问题讨论】:

  • 欢迎来到 SO!这种类型的问题感觉有点开放,可能不适合这里。为了获得更好的反馈,如果您提出问题,例如“这是我尝试过的一些代码,但这里是它的错误之处。我该如何解决它?”

标签: python filter fft wav analysis


【解决方案1】:

希望以下步骤对您有所帮助。

  1. 读取WAV文件:

    Reading *.wav files in Python

    Python Wave byte data

  2. 检测声音:

    Detect and record a sound with python

    Detect tap with pyaudio from live mic

    Python record audio on detected sound

  3. 确定声音块中的第一个异常点如:

    sample_rate = 44100
    wav_file_duration = 30*60   #in sec.
    first_abnormal_point_index = 20000
    

    那么声音的开始是:

    onset = first_abnormal_point_index/sample_rate * wav_file_duration
    

或者你也可以使用其他python包来做到这一点,比如 Modalaubio

【讨论】:

    猜你喜欢
    • 2012-01-13
    • 2011-05-17
    • 1970-01-01
    • 2017-11-03
    • 2018-10-25
    • 2022-10-15
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多