【发布时间】:2013-01-13 11:31:02
【问题描述】:
我有一个脚本,可以将系统日志文件读入 pandas 数据帧并从中生成图表。这些图表适用于小型数据集。但是当我面对更大的数据集时,由于数据收集时间较长,图表变得过于拥挤而无法辨别。
我计划重新采样数据帧,以便如果数据集通过一定大小,我将重新采样它,因此最终只有 SIZE_LIMIT 行数。这意味着我需要过滤数据帧,以便每个 n = actual_size/SIZE_LIMIT 行都会聚合到新数据帧中的一行。聚合可以是平均值,也可以是第 n 行。
我对 pandas 并不完全精通,所以可能错过了一些明显的方法。
【问题讨论】:
标签: pandas