【发布时间】:2014-03-28 14:56:46
【问题描述】:
我正在构建一个系统,该系统使用机器学习在播放主旋律时实时生成伴奏旋律。它使用一种循环神经网络,并且在每一步都尝试预测伴随音轨上的下一个音符。在这一点上,我对使用 MIDI 文件感到满意。
我遇到了严重的难以找到训练数据。我最初的想法是只从mididb等网站下载midi文件并将它们转换为csv,但问题是很难想出一种方法来区分主旋律和伴奏旋律强>。有时这是可能的,但我还是希望伴奏曲目总是来自相同(或相似)的乐器,因为不同的乐器使用方式不同(音符的持续时间和音高从一种乐器到其他等),这只会让网络非常混乱。
我在 the UCI Machine Learning repository 找到了 Bach Corales。然而,这个数据集的问题在于它只有一个声音的旋律。我想要具有 2 个声音的数据集,其中一个是主旋律,另一个是伴奏旋律。
我知道这很困难,因此非常感谢任何有关如何解决该问题的建议。我有将 midi 文件转换为 csv 格式的工具,如果你能想到某些类型/流派的歌曲,很容易区分前导曲目和伴奏曲目(以编程方式或手动),请告诉我。任何建议将不胜感激。
【问题讨论】:
-
要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是题外话,因为它们往往会吸引固执己见的答案和垃圾邮件。相反,请描述问题以及迄今为止为解决该问题所做的工作。
标签: machine-learning neural-network regression prediction