【问题标题】:Books on string algorithms [closed]关于字符串算法的书籍[关闭]
【发布时间】:2010-05-11 18:30:23
【问题描述】:

已经有很多关于字符串算法的帖子:

但是,没有提到一般文献。

谁能推荐一本可以彻底探索各种字符串算法的书? 特别感兴趣的主题是近似字符串匹配[诸如谷歌提供的更正搜索字符串变体之类的东西:)]。

非常感谢您的建议。

【问题讨论】:

标签: algorithm string-algorithm


【解决方案1】:

我很惊讶没有人提到 Dan Gusfield 的优秀书籍Algorithms on Strings, Trees and Sequences,它比任何人都可能需要的更详细地介绍了字符串算法。它对我几年前从事的蛋白质测序项目非常有用。阅读本书后,您将了解到:

  • 朴素字符串匹配
  • 基于预处理器的算法(Boyer Moore、Knuth-Morris-Pratt)
  • 正则表达式匹配算法
  • Karp-Rabin 和类似方法
  • 后缀树方法(Ukkonen 方法等)
  • 序列比对(Levenshtein 距离和字符串相似性,以及多序列比对)
  • 在 DNA 测序、基因预测和其他领域的应用。

【讨论】:

  • +1 它被称为“字符串树和序列的算法”,是一个很棒的参考
  • 而且它是“相对”新的(与其他答案中提到的其他文本相比),因为它包含了许多最近的学术著作。
【解决方案2】:

这不是一本书推荐,但这个库和站点是一个提供大量高效字符串匹配算法实现的库:

http://www.dcs.shef.ac.uk/~sam/simmetrics.html

它还为每个人提供了进一步学习的链接,以及每个人最适用的地方。

【讨论】:

  • 非常感谢这个。它似乎包含一大堆术语和主题的介绍。
【解决方案3】:

【讨论】:

    【解决方案4】:

    CLR 有一些字符串处理算法,但不是专门针对它们的。

    包括:

    【讨论】:

      【解决方案5】:

      TRE 是一个实现近似匹配的开源库。 About page 有一些关于它如何工作的有趣提示,尽管我不确定它是否提供了您正在寻找的那种深入分析。从这个角度来看,源代码可能更具启发性。

      【讨论】:

      • 谢谢,我去看看。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-06-19
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多