【问题标题】:Problem with spell checking packages in RR中的拼写检查包问题
【发布时间】:2021-09-10 16:33:27
【问题描述】:

我正在尝试使用 R 中的“hunspell”库检查一些俄语单词的拼写。

bad_words <- hunspell("Язвенная болзень", dict='ru_RU.dic')

我已经安装了俄语词典,来自这里:https://code.google.com/archive/p/hunspell-ru/ 它具有编码 UTF-8。但是,我有以下错误:

无法将第 1 行转换为 ISO8859-1 编码。尝试使用 UTF8 字典进行拼写。

看起来很奇怪,无论是 dict 还是 R 文件都没有编码 ISO8859-1... 有什么问题?

【问题讨论】:

    标签: r spell-checking hunspell


    【解决方案1】:

    如果您在 Windows 上操作,我的第一个猜测是这与 Windows 上的 R 中缺乏原生 UTF-8 支持有关。这将在 R4.2 发布时解决;您可能希望尝试使用development release 并查看问题是否仍然存在。

    要检查的另一件事是您的DESCRIPTION 文件是否包含Encoding: UTF-8 行,以便您的源文件被视为具有此编码。

    【讨论】:

      猜你喜欢
      • 2011-02-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-02-02
      • 1970-01-01
      • 2013-10-14
      • 2018-10-22
      • 1970-01-01
      相关资源
      最近更新 更多