【发布时间】:2020-04-01 08:28:05
【问题描述】:
我想在管理一些 pandas DataFrame 时减少内存消耗。 例如,我知道从 float64 切换到 flot32 的技巧,这很有趣。
更进一步,并且知道我的数值实际上具有“小”的绝对最小值和最大值,我想知道是否不能要求 pandas 对给定列使用比例因子?
最好的例子是百分比。
通过百分比,您知道最小值为 0,最大值为 1。这些最小值和最大值可以存储为列的属性。
然后我可以使用 int16 为例,列值将存储为 [-128; 之间的缩放值; 127]。然后在使用时,它们将使用已存储为列属性的最小值和最大值缩小到它们的“原始值”(进行一些舍入)。
这种方法可以用于管理 pandas DataFrames 吗?
感谢您的帮助和反馈! 最好的,
【问题讨论】:
标签: python pandas memory-management