【发布时间】:2017-12-21 09:30:36
【问题描述】:
我的数据库中似乎有一些以 UTF-8 格式存储的西里尔字母字符串。但是我需要使用 R 恢复西里尔文。
例如在数据库中它被存储为:"õÆ¿ª®Ï"。我需要的是Москва。
我尝试了一些使用 iconv 的东西,但不确定是否需要先对字符串进行双重转换:
1. iconv(x, "UTF-8", "CP1251") # I get NA
2. iconv(x, "CP1251", "UTF-8") # I get ûûû \"òƸл°¸»ª¿-õƸƺ±Ð\"
我假设我需要先将字符串从 UTF-8 恢复为西里尔字母,但我得到了 NA。
帮助赞赏
【问题讨论】: