Python音频wav文件分析

【问题标题】：Python audio wav file analysisPython音频wav文件分析
【发布时间】：2017-02-08 21:40:40
【问题描述】：

我正在开发一个程序，该程序需要 30 分钟的 wav 文件并针对各种事件对其进行分析。我有一堆 30 分钟的体育赛事 wav 文件，并试图以一种自动化方式来查找某些事件发生的时间。

例如，以下是我希望尝试识别的事件： - 当一个目标或事件发生时，人群中会发出噪音和欢呼声。我想返回这些事件发生的时间。 - 或者当哨声响起时 - 还能够识别长时间的完全沉默会有所帮助

我一直在尝试绘制这些音频样本的 FFT，并得出结论，这并不能让我对这些事件有最好的了解。最好的流程是什么？

任何指导将不胜感激。

谢谢

【问题讨论】：

欢迎来到 SO！这种类型的问题感觉有点开放，可能不适合这里。为了获得更好的反馈，如果您提出问题，例如“这是我尝试过的一些代码，但这里是它的错误之处。我该如何解决它？”

【解决方案1】：

希望以下步骤对您有所帮助。

确定声音块中的第一个异常点如：

sample_rate = 44100
wav_file_duration = 30*60   #in sec.
first_abnormal_point_index = 20000

那么声音的开始是：

onset = first_abnormal_point_index/sample_rate * wav_file_duration

或者你也可以使用其他python包来做到这一点，比如 Modal 或 aubio。

【讨论】：