【发布时间】:2012-03-12 18:11:40
【问题描述】:
我有一大段代码用于阅读 MS Office Word 文档。
static void ReadMSOfficeWordFile(string file) {
try {
Microsoft.Office.Interop.Word.Application msWordApp = new Microsoft.Office.Interop.Word.Application();
object nullobj = System.Reflection.Missing.Value;
object ofalse = false;
object ofile = file;
Microsoft.Office.Interop.Word.Document doc = msWordApp.Documents.Open(
ref ofile, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj);
string result = doc.Content.Text.Trim();
doc.Close(ref ofalse, ref nullobj, ref nullobj);
msWordApp.Quit();
CheckLineMatch(file, result);
}
catch {
RaiseError("Unable to parse file because of MS Office error.", file);
}
}
我对此有三个问题。
首先- 它依赖于安装在每个可能运行它的系统上的 MS Office。有些人更喜欢 Libre Office,但这仍然需要针对 MS Office Word 文档运行。
第二 - 我不知道这是否适用于 MS Office 2003 和 MS Office 2007 文档...
第三-它很慢。速度太慢了。
所以!我认为必须有比这更好的方法来运行它。我猜有人必须知道比新手更好的方法。我只是想阅读文档中的文字,没有别的。
【问题讨论】: