【发布时间】:2012-12-18 00:54:05
【问题描述】:
我正在尝试构建一个 C# 应用程序来检测视频中何时出现音乐。 我可以找到所需的任何格式的音频。然而,我在音乐检测方面遇到了障碍。
有大量关于音频指纹识别以及如何使用 C#/任何语言执行此操作的帖子。但是,我希望电影中出现音乐的粗略进出时间,我不关心音乐是什么。
音乐不太可能存在于任何指纹数据库中。所以很可能是一个完全计算分析。
有什么聪明的主意吗?或者我最好实现一个节拍检测算法并逐个处理它。然后估计入点/出点?
【问题讨论】:
-
坦率地说,这似乎值得一篇研究论文。您可能也想尝试搜索这些内容。
-
您是否也在寻找背景/场景过渡音乐?
-
我同意@RBarryYoung 的观点,尝试搜索类似于“音乐检测小波”的内容 - 您将遇到许多研究论文,其中点缀着大量方程。小波是一种比 FFT 从信号中获取频率信息更复杂的方法。
-
查看做过音乐分析的项目,例如 Aubio 和 echonest。
标签: c# audio audio-processing