"sys.getsizeof(int)" 返回一个不合理的大值？答案

【问题标题】："sys.getsizeof(int)" returns an unreasonably large value?"sys.getsizeof(int)" 返回一个不合理的大值？
【发布时间】：2012-05-09 02:04:50
【问题描述】：

我想在python中检查int数据类型的大小：

import sys
sys.getsizeof(int)

结果是“436”，这对我来说没有意义。无论如何，我想知道我的机器将占用多少字节 (2,4,..?) int。

【问题讨论】：

请注意，python 支持非常大的数字，这意味着您几乎肯定不会得到 2 或 4 或什至接近的数字。您真正想做什么？弄清楚您运行的是 32 位还是 64 位操作系统/CPU？

标签： python

【解决方案1】：

简短的回答

您得到的是类的大小，而不是类实例的大小。调用int获取实例大小：

>>> sys.getsizeof(int())
24

如果该大小看起来仍然有点大，请记住 Python int 与（例如）c 中的 int 非常不同。在 Python 中，int 是一个成熟的对象。这意味着有额外的开销。

除了其他存储之外，每个 Python 对象都至少包含一个引用计数和对该对象类型的引用；在 64 位机器上，占用 16 个字节！ int 内部结构（由标准 CPython 实现决定）也随着时间而改变，因此占用的额外存储量取决于您的版本。

关于 Python 2 和 3 中 `int` 对象的一些细节

这是 Python 2 中的情况。（其中部分内容改编自 Laurent Luce 的博客文章）。整数对象表示为具有以下结构的内存块：

typedef struct {
    PyObject_HEAD
    long ob_ival;
} PyIntObject;

PyObject_HEAD 是定义引用计数和对象类型的存储的宏。 documentation有详细描述，代码见this答案。

内存是按大块分配的，因此每个新整数都不会出现分配瓶颈。该块的结构如下所示：

struct _intblock {
    struct _intblock *next;
    PyIntObject objects[N_INTOBJECTS];
};
typedef struct _intblock PyIntBlock;

这些一开始都是空的。然后，每次创建一个新整数时，Python 都会使用next 指向的内存并递增next 以指向块中的下一个空闲整数对象。

我不完全确定一旦超过普通整数的存储容量，这将如何变化，但一旦你这样做了，int 的大小就会变大。在我的机器上，在 Python 2 中：

>>> sys.getsizeof(0)
24
>>> sys.getsizeof(1)
24
>>> sys.getsizeof(2 ** 62)
24
>>> sys.getsizeof(2 ** 63)
36

在 Python 3 中，我认为总体情况是一样的，但整数的大小以更零碎的方式增加：

>>> sys.getsizeof(0)
24
>>> sys.getsizeof(1)
28
>>> sys.getsizeof(2 ** 30 - 1)
28
>>> sys.getsizeof(2 ** 30)
32
>>> sys.getsizeof(2 ** 60 - 1)
32
>>> sys.getsizeof(2 ** 60)
36

当然，这些结果都取决于硬件！ YMMV。

Python 3 中整数大小的可变性暗示它们的行为可能更像可变长度类型（如列表）。事实上，事实证明这是真的。这是 Python 3 中 int 对象的 C struct 的定义：

struct _longobject {
    PyObject_VAR_HEAD
    digit ob_digit[1];
};

伴随此定义的 comments 总结了 Python 3 的整数表示。零不是由存储值表示，而是由大小为零的对象表示（这就是为什么sys.getsizeof(0) 是24 字节，而sys.getsizeof(1) 是28）。负数由具有负大小属性的对象表示！好诡异。

【讨论】：

谢谢！但我的系统返回 12 的大小。是字节吗？如果以字节为单位，则比我想象的要大，如果以位为单位，则不合理......
@HailiangZhang，这是 12 个字节——在我的例子中是 24 个字节。 Python int 与（例如）c 中的 int 非常不同。在 Python 中，int 是一个成熟的对象。这意味着有额外的开销。有关 (cpython) int 内部的相当详细的讨论，请参阅 here。
@HailiangZhang，另外，this 描述了您在上面链接的页面中看到的 PyObject_HEAD 宏的结构。除了其他存储之外，每个 Python 对象都至少包含一个引用计数和对该对象类型的引用。
如果要存储大量紧凑存储的 32 位（或更少位）整数，请参阅array 模块。
请注意，结果为 24 只为 0（这是 int() 返回的值）。试试sys.getsizeof(1)，你会得到 28。

简短的回答

关于 Python 2 和 3 中 int 对象的一些细节

关于 Python 2 和 3 中 `int` 对象的一些细节