【发布时间】:2023-05-17 03:16:01
【问题描述】:
有谁知道如何将 shell 命令的输出(一系列 csvkit 工具调用)流式传输到 jupyter 笔记本单元格,但特别是流式传输到 Pandas DataFrame。从单元格的内容来看,它看起来像这样:
output = !find /path -name "*.csv" | csvstack ... | csvgrep ...
df = DataFrame.read_csv(output)
只有上述不是真正的工作。 shell 的输出非常大,有数百万行,Pandas 可以处理得很好,但我不希望输出作为字符串全部加载到内存中。
我正在寻找一种允许 Pandas 读取输出的管道/流式传输解决方案。
【问题讨论】:
-
.@Dmitry 将 csv 读入剪贴板,然后 pd。读剪贴板?就目前所知,熊猫不处理流..
标签: python pandas jupyter-notebook csvkit