【发布时间】:2017-07-06 15:20:04
【问题描述】:
我想从 docx 文件中提取文本,我尝试过使用 mammoth
var mammoth = require("mammoth");
mammoth.extractRawText({path: "./doc.docx"})
.then(function(result){
var text = result.value; // The raw text
//this prints all the data of docx file
console.log(text);
for (var i = 0; i < text.length; i++) {
//this prints all the data char by char in separate lines
console.log(text[i]);
}
var messages = result.messages;
})
.done();
但这里的问题是,在这个 for 循环中,我希望逐行而不是逐字符地获取数据,请在这里帮助我,或者您知道其他方法吗?
【问题讨论】:
-
逐行是什么意思?像 word 文档的单行,或者用换行符分隔的段落?
-
喜欢文档@ExplosionPills 的各个行
-
一种方法是用 "\n"s 分割你的文本!
-
您是否运行了此代码,在控制台中,它在新行中逐字符打印数据。不需要用“\n”分割。 @tashakori
-
不!你理解错了:-)。我的意思是用“\n”字符分割文本本身。然后你有一系列的线条! Var 行 = text.split ("\n")。然后行 [i] 表示第 i 行文本。