【发布时间】:2015-06-01 09:00:12
【问题描述】:
我尝试使用 Perl 模块 File::Slurp 读取 HTML 文件:
binmode STDOUT, ':utf8';
my $htmlcontent = read_file($file, {binmode => ':utf8'});
但是当我打印 $htmlcontent 变量时,由于法语口音或特殊字符,某些字符无法理解。
例如:"Plus d'actualit\u00e9s" 应该是"Plus d'actualités"
我也检查了文件的编码,没问题!
HTML document, UTF-8 Unicode text, with very long lines, with CRLF, LF line terminators
这个模块有问题吗?
谢谢
【问题讨论】: