【问题标题】:Open source spell check开源拼写检查
【发布时间】:2010-11-07 23:54:05
【问题描述】:

正在评估为我拥有的产品添加拼写检查。根据我的研究,需要做出的主要决定:

  1. 要使用的库。
  2. 字典(可以是特定地区、英式英语、美式等)。
  3. 排除列表。任何时候检测到拼写错误,都可能不是拼写错误,而是 特定于用户的措辞。在这一点上,用户应该能够
    将此添加到他的自定义排除列表中。
  4. 除了每个用户自定义列表之外,还有一个基于用户空间的排除列表 该工具的客户。那是用户工作域中的术语/首字母缩写词。例如,外汇不会成为货币交易者的错别字。

下面列出了我的未决问题,如果我能对它们提出意见,那将非常有用。 对于 1,我在想 hunspell,它是 MPL 下提供的开源库,被 firefox 和 OpenOffice 系列产品使用。有没有使用这个的恐怖故事? 任何许可的灰色区域?拼写检查将在 Windows 客户端上进行。

词典可从多种来源获得,有些在 MPL 下是免费的,有些则不是。关于免费词典的良好来源的任何建议。

多语言支持以及需要解决哪些问题来支持它们?

对于 4,自定义词典如何与服务器端和客户端保持同步?拼写检查需要在客户端进行,所以它们是每次都在初始启动时下推还是经常同步?

【问题讨论】:

  • 您使用的是什么编程语言/平台?
  • Windows 不是基于网络的。它将作为客户端安装提供。

标签: nlp spell-checking languagetool


【解决方案1】:

这是 Peter Norvig 的一个很好的演示:我发现这个简单的解释更加直观。也可以按照文档中的链接进行更深入的分析。

http://norvig.com/spell-correct.html

【讨论】:

    【解决方案2】:

    如前所述,Hunspell 是最先进的拼写检查器。它是 Open Office、Thunderbird、Firefox 和 Google Chrome 拼写检查器。所有主要编程语言的端口都可用。它适用于开放式办公室目录,因此支持多种语言。

    【讨论】:

      【解决方案3】:

      有几个广泛使用的流行选项:myspell、aspell。检查它们。

      【讨论】:

      • Hunspell 基于 MySpell 并且更高级一些。
      【解决方案4】:

      我用Hunspell 做了一些事情,我真的没有任何关于它的恐怖故事。虽然我只在英语(美式)中使用过它,但它声称可以与其他语言一起使用。

      在许可方面,它提供 GPL、LGPL 和 MPL 选择。如果您不喜欢 MPL,您可以随时选择使用 LGPL。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2017-07-09
        • 2015-02-14
        • 1970-01-01
        • 1970-01-01
        • 2010-10-09
        • 1970-01-01
        • 1970-01-01
        • 2011-02-11
        相关资源
        最近更新 更多