【问题标题】:Encoding of CSV file from Excel (Mac) when reading it into R将 Excel (Mac) 中的 CSV 文件读入 R 时对其进行编码
【发布时间】:2016-11-25 09:57:40
【问题描述】:

我有一个带有一些文本的 Excel 文件。我已将其保存为 CSV 文件并使用 readr::read_csv2() 读入 R。但我不知道如何摆脱下面的奇怪字符:

[131] "W<U+008A>rmflasche <e3>Hug<d2>\r \r"                                             
[132] "Held f<U+009F>r einen Tag <d0> Aufblasbare Superhelden-Ausr<U+009F>stung \r"     
[133] "Metallic Tattoos & Haarkrone <d0> Fashion Set\r"                             

我尝试使用iconv,但我不知道文件最初是以哪种编码方式保存的。

编辑:我正在添加 csv 文件的第一行:

name;product_details
Geschenkset Cupcake Dekoration ;"Erh�ltlich in vier Varianten: Cupcake Geschenkset � Weihnachtsglitzer"

【问题讨论】:

  • 你能显示 iconv 行吗?以及 csv 文件中包含此类数据的部分内容
  • 你认为这可能是我的机器的问题吗?我刚刚发现,当从 tibble 打印出来时,我也会得到奇怪的字符,例如"小数点:325 2"
  • 文件中设置的编码是什么 -> 使用编码重新打开,设置为 utf-8 并尝试
  • 也粘贴一些 csv 文件,会有帮助的
  • 那没用;我从控制台得到的这一行:“A tibble: 325 2”。会不会是整个 R 使用不同的编码?我正在使用带有 macOS Sierra 的 MacBook Pro 2016

标签: r excel csv encoding


【解决方案1】:

尝试像这样读取您的文件

readLines("filepath", encoding="UTF-8")

【讨论】:

    【解决方案2】:

    事实证明,我遇到了这个问题Set locale to system default UTF-8 中描述的相同问题。投票最多的回答也解决了我的问题。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2020-10-12
      • 2015-09-24
      • 2022-06-23
      • 1970-01-01
      • 2017-05-31
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多