【发布时间】:2010-11-07 23:54:05
【问题描述】:
正在评估为我拥有的产品添加拼写检查。根据我的研究,需要做出的主要决定:
- 要使用的库。
- 字典(可以是特定地区、英式英语、美式等)。
- 排除列表。任何时候检测到拼写错误,都可能不是拼写错误,而是
特定于用户的措辞。在这一点上,用户应该能够
将此添加到他的自定义排除列表中。
- 除了每个用户自定义列表之外,还有一个基于用户空间的排除列表 该工具的客户。那是用户工作域中的术语/首字母缩写词。例如,外汇不会成为货币交易者的错别字。
下面列出了我的未决问题,如果我能对它们提出意见,那将非常有用。 对于 1,我在想 hunspell,它是 MPL 下提供的开源库,被 firefox 和 OpenOffice 系列产品使用。有没有使用这个的恐怖故事? 任何许可的灰色区域?拼写检查将在 Windows 客户端上进行。
词典可从多种来源获得,有些在 MPL 下是免费的,有些则不是。关于免费词典的良好来源的任何建议。
多语言支持以及需要解决哪些问题来支持它们?
对于 4,自定义词典如何与服务器端和客户端保持同步?拼写检查需要在客户端进行,所以它们是每次都在初始启动时下推还是经常同步?
【问题讨论】:
-
您使用的是什么编程语言/平台?
-
Windows 不是基于网络的。它将作为客户端安装提供。
标签: nlp spell-checking languagetool