【发布时间】:2019-02-20 16:26:33
【问题描述】:
我有 18 个 csv 文件,大小都在 1mb 到 14mb 之间。所有文件的总和为 64mb。我想创建一个新的 csv 文件,其中包含这些文件的子集——只有具有模式“Hello”(或“HELLO”或“hello”......)的行。这就是我正在做的事情
cat *.csv | head -n 1 > new.csv # I want to create a header first
cat *.csv | grep -i "hello" >> new.csv
我在WSL 上运行 Debian。输出文件比原来的 64mb 大得多(我在 1+ 小时后停止了这个过程,文件是 300+ GB)。
文本文件的子集如何比原始文件大?跟WSL有关系吗?
【问题讨论】: