【发布时间】:2018-05-06 14:19:32
【问题描述】:
如何转换带有 UTF-8 实体字符的 doc 文件并自动将实体转换为其正确的十六进制 NCR 序列(例如 ꯍ)
以下是 doc 文件中的示例文本:
Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.
将其转换为 txt 文件后,输出应为:
Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.
我做到了。
Document document = new Document();
string docPath = @"C:\Users\Tamal\Desktop";
document.LoadFromFile(Path.Combine(docPath,"op.docx"));
document.SaveToFile(Path.Combine(docPath,"op.txt"), FileFormat.Txt);
string readText = File.ReadAllText(Path.Combine(docPath,"op.txt"));
System.Diagnostics.Process.Start(Path.Combine(docPath,"op.txt"));
Console.ReadLine();
但这会将文本文件输出为(与 doc 文件完全相同):
Isto é um teste. Eu não me importo com o que você pensa.
Você acha que me conhece muito bem.
如何以及在哪里添加实体十六进制转换?
注意:我正在使用 Spire.Doc 将 doc 转换为 txt。
【问题讨论】: