【问题标题】:Hunspell - How to specify case-insensitivity for spell check in dic or aff fileHunspell - 如何为 dic 或 aff 文件中的拼写检查指定不区分大小写
【发布时间】:2016-02-26 02:27:48
【问题描述】:

我正在使用开源 hunspell dic/aff 集作为起点创建自定义拼写检查引擎实现。经过大量的黑客攻击、谷歌搜索等,我复制了一个出现的标志集以导致不区分大小写的搜索(例如,拼写检查通过“Word”和“word”,当 dic 文件中仅存在“word”时)。问题是,我不知道为什么会这样,而且我在网上或文件中找不到任何表明如何处理案例的内容。我的 dic 中有效的语法是:

word/1   1

没有这些标志,案件处理是严格的。

我没有实施一个我无法解释的“解决方案”。任何人都知道如何在 dic/aff 集中指定案例处理,以便我可以弄清楚实际发生了什么?

【问题讨论】:

    标签: hunspell


    【解决方案1】:

    默认情况下,.dic 文件中的条目被假定为不区分大小写,因此给定条目 word,以下所有内容都应按正确拼写返回:word、Word、WORD em>。

    如果要将单词限制为单个大小写,则需要在 .aff 文件中定义区分大小写的标志:

    KEEPCASE X
    

    X 是一个或两个字母标志或数字(基于您的 FLAG 设置)

    所以,如果我只想允许 John(而不是 johnJOHN),我可以输入我的 .dic归档以下条目:

    John/X
    

    我不知道为什么/1 允许不区分大小写的结果,尤其是因为该行格式错误(空格后唯一应该跟随的是字段 id 及其信息,例如,@987654329 @)

    您说您正在创建自定义引擎,因此问题将出在您的引擎中,而不是在 .dic/.aff 文件中。

    【讨论】:

    • 如果有AF 那么/1 匹配第一个AF 规则
    猜你喜欢
    • 1970-01-01
    • 2011-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-02-03
    • 2013-04-15
    • 2015-04-30
    • 2016-01-22
    • 1970-01-01
    相关资源
    最近更新 更多