【问题标题】:distance between QStrings of several words Qt c++几个单词的QStrings之间的距离Qt c ++
【发布时间】:2015-03-10 08:38:12
【问题描述】:

我目前正在尝试比较两个由几个单词组成的字符串。我知道可以使用 levenstein 算法获得两个字符串之间的距离。它运作良好。但是我怎样才能得到几个单词之间的距离呢?

我正在编写一个应用程序,该应用程序从电影标题中研究 TMDB,我得到了几个标题作为结果。我需要将标题结果与我的电影标题相关联。我的想法是逐个比较单词并保持最佳结果,但我认为这不是最好的方法。

我需要它来考虑拼写错误(星球大战/星球大战)、数字(矩阵 1、矩阵 2 等...)、更多单词(矩阵 2 - 重新加载/矩阵重新加载)。

感谢您的帮助。我正在使用 C++ Qt。

【问题讨论】:

    标签: c++ algorithm qt comparison qstring


    【解决方案1】:

    对于比较自然语言,最成功的模型之一是“词袋”:http://en.wikipedia.org/wiki/Bag-of-words_model,这在许多垃圾邮件过滤工具中被广泛使用并取得了成功。 当然有 c++ 实现,一个著名的在 openCV 内部,但如果我是你,我会尝试编写自己的变体,包括 levenstein 算法。

    【讨论】:

    • 谢谢,我去看看。我和你一样想,我必须写我自己的变体。在我让算法工作之前,我可能会对我的电影进行几次尝试。但我想知道它已经存在了^^。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-04-28
    • 2011-09-30
    • 2021-06-13
    • 2016-05-11
    • 1970-01-01
    相关资源
    最近更新 更多