【发布时间】:2015-12-02 15:10:21
【问题描述】:
我想知道是否有任何有效的方法可以逐行比较 2 个大文件。
文件 1
2
3
2
文件 2
2 | haha
3 | hoho
4 | hehe
我只是取每个文件的第一个字符并与它们进行比较。目前我正在使用一种非常幼稚的方法在双 for 循环中迭代它们。
喜欢
For i in file 1:
line number = 0
For j in file 2:
loop until line number == counter else add 1 to line number
Compare line 1
increase counter
将这两个文件都读入内存不是一种选择。我在 linux 上使用 python,但我对 bash 解决方案和 python 脚本解决方案都持开放态度
【问题讨论】:
-
所以你想将每一行与另一个文件中的同一行进行比较?
zip他们! -
@Jornsharpe 我无法压缩它们,因为我无法将它们加载到内存中
-
如果你使用的是 2.x,
itertools.izip他们
标签: python linux file iterator