【问题标题】:R string encoding cyrillicR字符串编码西里尔文
【发布时间】:2017-12-21 09:30:36
【问题描述】:

我的数据库中似乎有一些以 UTF-8 格式存储的西里尔字母字符串。但是我需要使用 R 恢复西里尔文。

例如在数据库中它被存储为:"õÆ¿ª®Ï"。我需要的是Москва

我尝试了一些使用 iconv 的东西,但不确定是否需要先对字符串进行双重转换:

1. iconv(x, "UTF-8", "CP1251")  # I get NA
2. iconv(x, "CP1251", "UTF-8")  # I get  ûûû \"òƸл°¸»ª¿-õƸƺ±Ð\"

我假设我需要先将字符串从 UTF-8 恢复为西里尔字母,但我得到了 NA。

帮助赞赏

【问题讨论】:

    标签: r encoding iconv cyrillic


    【解决方案1】:

    enc2nativeenc2utf8 将字符向量的元素分别转换为本机编码或 UTF-8,同时考虑任何标记的编码。它们是原始函数,旨在进行最少的复制。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2013-10-29
      • 2013-01-19
      • 2016-02-29
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多