【发布时间】:2020-06-02 20:31:03
【问题描述】:
我正在尝试创建一个程序,该程序将读取和分析 .wav 文件,找到与时间有关的幅度 + 频率,将其设置为数组([时间幅度频率](id est: [x y z]))并通过中立网络运行它。我的问题是我需要恒定数量的值,但音频剪辑的长度不同。
我如何“平均”(某种意义上)数据以创建一个数组,例如,从 22050 中提取 20 000 个值,以及对 17500 数组执行相同操作?
最好使用原始 .wav 数据或幅度/频率来执行此操作(如果可能)
编辑:为澄清起见,我希望保持音频不变,因此不要加快/减慢它,因为我将它用于专门针对我的声音的语音识别程序。
我还希望避免在数组末尾添加空值,但我可能不得不求助于此。
【问题讨论】:
标签: python wav data-analysis