【发布时间】:2013-10-01 22:54:28
【问题描述】:
字符0x91、0x92、0x93和0x94应该代表Unicode中的U+2018、U+2019、U+201c和U+201d,或者“开头单引号”、“关闭单引号”、“打开双引号”和“关闭双引号”。我以为是ISO-8859-1,但是当我尝试使用IO.read('file', :encoding=>'ISO-8859-1') 处理文件时,它仍然无法识别这些字符。
如果不是ISO-8859-1 那是什么?如果是,为什么 ruby 不能识别这些字符?
更新:显然这种编码应该是 Windows-1252。但是当我IO.read('file', :encoding=>'Windows-1252') 时,ruby 仍然无法识别这些字符。
更新 2:没关系,Windows-1252 有效。
【问题讨论】:
标签: ruby-on-rails ruby encoding extended-ascii