【发布时间】:2026-01-02 07:05:02
【问题描述】:
我有来自 srt 字幕文件的歌词。如果我想将它们与另一个歌词网站上的节进行匹配,最好的方法是什么?
我的方法是使用 tf-idf 向量每个歌词行并尝试模糊匹配到 staza,使用歌词行的开始和结束时间作为线索是否该行可能属于前一个节,下一个节,或属于它自己的节。
我也尝试过动态编程,但不太成功。由于歌词和节的结构差异很大,有时结果会完全偏移或混乱,特别是如果有重复的合唱。
如果有循环神经网络或其他机器学习算法,是否有解决此类问题的现有方法?
【问题讨论】:
标签: machine-learning nlp sentence-similarity