【发布时间】:2012-08-22 06:19:58
【问题描述】:
如何从 ruby 字符串中删除非 UTF8 字符?我有一个字符串,其中包含例如“xC2”。我想从字符串中删除该字符,使其成为有效的 UTF8。
这个:
text.gsub!(/\xC2/, '')
返回错误:
incompatible encoding regexp match (ASCII-8BIT regexp with UTF-8 string)
我也在查看 text.unpack('U*') 和 string.pack,但没有得到任何结果。
【问题讨论】: