【发布时间】:2026-01-10 20:10:02
【问题描述】:
我正在尝试从音频文件中提取音高特征,用于分类问题。我正在使用 python(scipy/numpy) 进行分类。
我想我可以使用scipy.fft 获得频率特征,但我不知道如何使用频率来近似音符。我进行了一些研究,发现我需要获取将频率映射到12 箱的色度特征,以获取半音阶音符。
我认为 matlab 有一个色度工具箱,但我认为 python 没有任何类似的东西。
我应该如何进行? 任何人都可以建议阅读我应该研究的材料吗?
【问题讨论】:
标签: python audio scipy feature-extraction