【发布时间】:2019-12-27 22:56:18
【问题描述】:
Octave 4.2.2 使用fscanf 命令读取ISO-8859-1 字符(格式化为读取空格):
foo = fscanf(foofile1, "%*s %[^\n]");
而fgetl 读取原生UTF-8:
foo = fgetl(foofile2);
两个文件都显示为UTF-8:
$ file -i foofile1.csv
foofile1.csv: text/plain; charset=utf-8
$ file -i foofile2.html
foofile2.html: text/html; charset=utf-8
有没有什么办法可以用fscanf读取UTF-8格式的HTML文件?
更新:正如@TS 所指出的,这已被报告为savannah.gnu.org 中的一个错误。
【问题讨论】:
-
这个解决方法是否提到here 工作:
deal(textscan(foofile1, "%*s %[^\n]"){:});? -
同样的结果,@TS,它不是以 UTF-8 格式读取的。
-
您能否提供具有预期输出的最小示例(ANSI 和 utf8)?
标签: utf-8 scanf octave iso-8859-1