【发布时间】:2011-08-27 09:18:11
【问题描述】:
我有一个 Python (2.4/2.7) 脚本,它使用 fileinput 从标准输入或文件中读取。它易于使用,并且除了一种情况外效果很好:
tail -f log | filter.py
问题是我的脚本缓冲了它的输入,而(至少在这种情况下)我想立即看到它的输出。这似乎源于 fileinput 在执行任何操作之前使用readlines() 获取其bufsize 的字节值。我尝试使用 1 的 bufsize,但它似乎没有帮助(这有点令人惊讶)。
我确实发现我可以编写这样不缓冲的代码:
while 1:
line = sys.stdin.readline()
if not line: break
sys.stdout.write(line)
这样做的问题是我失去了文件输入功能(即它会自动打开传递给我的程序的所有文件,如果没有,它甚至可以自动解压缩输入文件)。
那么我怎样才能两者兼得呢?理想情况下,我不需要显式管理我的输入文件列表(包括解压缩),但在以“流式”方式使用时不会延迟输入。
【问题讨论】:
-
关闭标准输入文件句柄并用
buffering = 0重新打开它(我没试过,所以我不会把它作为答案发布) -
您可能会通过说 fileinput 使用 readlines() 来误解这种情况。默认情况下,readlines() 在到达 EOF 之前不会返回,而 'for line in fileinput.input():' 和 'for line in sys.stdin:' 最终会在缓冲足够的字符时返回一些内容。不过,如果 fileinput 传递了一个 bufsize 参数,您可能是对的。
-
我刚刚提交了错误报告bugs.python.org/issue26290“fileinput 和 'for line in sys.stdin' 对输入缓冲进行了奇怪的嘲弄”,其中包括您观察到的行为。摘要:fileinput 在 2.7 和 3.4 中都损坏了,“for line in sys.stdin:”在 2.7 中损坏但在 3.4 中修复,readline 在 2.7 和 3.4 中都可以正常工作。
标签: python readline buffering file-io