【发布时间】:2013-06-06 00:30:17
【问题描述】:
我正在编写一个使用 Hpricot 的爬虫。它从某个网页下载字符串列表,然后我尝试将其写入文件。编码有问题:
"\xC3" from ASCII-8BIT to UTF-8
我有在网页上呈现并以这种方式打印的项目:
Développement
str.encoding 返回UTF-8,所以force_encoding('UTF-8') 没有帮助。如何将其转换为可读的 UTF-8?
【问题讨论】:
-
Hpricot 不再维护,考虑使用 Nokogiri。另外,您可能应该提到原始网页的编码是什么。
标签: ruby file encoding utf-8 dump