【发布时间】:2017-06-12 18:53:36
【问题描述】:
从question 和其他人看来,似乎不建议使用concat 或append 来构建熊猫数据框,因为它每次都在重新复制整个数据框。
我的项目涉及每 30 秒检索一次少量数据。这可能会持续 3 天的周末,因此有人可以很容易地期望一次创建超过 8000 行。向此数据框添加行的最有效方法是什么?
【问题讨论】:
-
如果你只是每30秒添加一行,真的需要高效吗?
-
有什么理由需要它是一个DataFrame吗?为什么不直接将其写入文件,然后在最后进行转换?
-
@Stephen Rauch 好吧,我希望我的样本尽可能接近每 30 秒一次。可能是错误的,我正在提取数据,然后将其添加到数据框中,然后使用
time.sleep(30)直到获取下一组数据。我担心的是加载时间会开始扩大每个样本之间的时间。从这个问题link看来,大小为 6000 需要 2.29 秒。如果可能的话,我希望将这个数字保持在最低限度。 -
如果您担心 30 秒睡眠将不准确,因为附加数据需要更长的时间,然后修复睡眠。
next_time += 30, time.sleep(next_time-time.time()) -
@Stephen Rauch 哦,这是个好主意!
标签: python pandas numpy dataframe