【发布时间】:2017-10-31 22:19:44
【问题描述】:
我正在尝试读取 2000 万行文件并将行结尾从 windows 更正为 mac。我知道它可以在 sed 中完成,但 sed 给了我一个我不知道如何修复的错误(dos2unix:在第 625060 行找到二进制符号 0x0008)。所以我试图在 NodeJS 中解决这个问题。这是我的代码:
var fs = require('fs');
var eol = require('eol');
//read file
var input = fs.readFileSync(process.argv[2], 'utf8');
//fix lines
output = eol.auto(input);
console.log("Lines Fixed! Now Writing....")
//write file
fs.writeFile(process.argv[2] + '_fixed.txt', output, function (err) {
if (err) return console.log(err);
});
console.log("Done!")
问题是文件太大,我得到这个错误 buffer.js:513 throw new Error('"toString()" failed');
【问题讨论】:
-
好吧,我主要想知道如何拆分文件并在 NodeJS 中进行。我只添加了 sed 解释,因为我问过的每个人都只是告诉我在 sed 中这样做,而我做不到。