【问题标题】:Turkish Character Encoding in RR中的土耳其语字符编码
【发布时间】:2015-01-19 11:43:44
【问题描述】:

有没有办法根据土耳其语改变R中的字符编码系统?

我尝试更改编码,同时将 R 脚本保存为 iso-8859-9、windows-1254 或 latin5。最后一次编码给了我最好的结果,但是当我重新加载 R 脚本时,并不是所有的字符都被正确保存了。例如:

原文:

hâkimiyetinin
çıkıyor

正在重新加载(第二个示例中的字符已损坏):

hâkimiyetinin
çýkýyor

任何人的想法?提前谢谢!

【问题讨论】:

    标签: r encoding turkish


    【解决方案1】:

    我遇到了类似的问题,我尝试了几件事,包括以色列的答案,但唯一对我有帮助的是更改语言环境。

    我刚刚在 RStudio 控制台中输入了以下命令。

    Sys.setlocale(category = "LC_ALL", locale = "Turkish")
    

    现在,每当我输入 İstanbul 时,我都会在 I 上看到一个点。在我将它设置为 UTF-8 之前,它仍然会导致问题。

    我找到了this question about Greek characters,但原理基本相同。只需将“希腊语”更改为“土耳其语”即可。

    【讨论】:

      【解决方案2】:

      这个函数应该告诉你机器中有哪些编码

      iconvlist()
      

      这应该告诉你字符串 pal 是在哪个编码中

      Encoding(pal)
      

      这应该会改变朋友的编码

       Encoding(pal) <- "latin1"
      

      这应该将 pal 翻译成某种编码

      pal <- iconv(pal, to='ASCII//TRANSLIT')
      

      我不知道这个编码是不是你要找的

      "x-mac-turkish" or "macturkish"  
      

      希望对你有帮助

      【讨论】:

        猜你喜欢
        • 2015-01-07
        • 1970-01-01
        • 1970-01-01
        • 2011-08-27
        • 2012-06-28
        • 2014-07-25
        • 1970-01-01
        • 2012-01-02
        • 1970-01-01
        相关资源
        最近更新 更多