【发布时间】:2021-12-06 02:44:30
【问题描述】:
我有一个 Python 程序,它控制一些机器并存储一些数据。数据以每秒大约 20 行(大约 10 列左右)的速度生成。该程序的整个运行时间可能长达一周,因此数据框很大。
有哪些安全且正确的方式来存储这些数据?安全的意思是,如果在第 6 天出现故障,我仍将拥有第 1→6 天的所有数据。正确的意思是不要在每个循环中将整个数据帧重新写入文件。
我当前的解决方案是 CSV 文件,我只是手动打印每一行。这种方案既安全又正确,但问题是CSV不保留数据类型,而且占用内存较多。所以我想知道是否有二进制解决方案。我喜欢羽毛格式,因为它非常快,但它不允许追加行。
【问题讨论】:
-
不将数据写入文件,而是将其存储在database 中怎么样?