【问题标题】:"sys.getsizeof(int)" returns an unreasonably large value?"sys.getsizeof(int)" 返回一个不合理的大值?
【发布时间】:2012-05-09 02:04:50
【问题描述】:

我想在python中检查int数据类型的大小:

import sys
sys.getsizeof(int)

结果是“436”,这对我来说没有意义。 无论如何,我想知道我的机器将占用多少字节 (2,4,..?) int。

【问题讨论】:

  • 请注意,python 支持非常大的数字,这意味着您几乎肯定不会得到 2 或 4 或什至接近的数字。您真正想做什么?弄清楚您运行的是 32 位还是 64 位操作系统/CPU?

标签: python


【解决方案1】:

简短的回答

您得到的是 的大小,而不是类实例的大小。调用int获取实例大小:

>>> sys.getsizeof(int())
24

如果该大小看起来仍然有点大,请记住 Python int 与(例如)c 中的 int 非常不同。在 Python 中,int 是一个成熟的对象。这意味着有额外的开销。

除了其他存储之外,每个 Python 对象都至少包含一个引用计数和对该对象类型的引用;在 64 位机器上,占用 16 个字节! int 内部结构(由标准 CPython 实现决定)也随着时间而改变,因此占用的额外存储量取决于您的版本。

关于 Python 2 和 3 中 int 对象的一些细节

这是 Python 2 中的情况。(其中部分内容改编自 Laurent Luce 的博客文章)。整数对象表示为具有以下结构的内存块:

typedef struct {
    PyObject_HEAD
    long ob_ival;
} PyIntObject;

PyObject_HEAD 是定义引用计数和对象类型的存储的宏。 documentation有详细描述,代码见this答案。

内存是按大块分配的,因此每个新整数都不会出现分配瓶颈。该块的结构如下所示:

struct _intblock {
    struct _intblock *next;
    PyIntObject objects[N_INTOBJECTS];
};
typedef struct _intblock PyIntBlock;

这些一开始都是空的。然后,每次创建一个新整数时,Python 都会使用next 指向的内存并递增next 以指向块中的下一个空闲整数对象。

我不完全确定一旦超过普通整数的存储容量,这将如何变化,但一旦你这样做了,int 的大小就会变大。在我的机器上,在 Python 2 中:

>>> sys.getsizeof(0)
24
>>> sys.getsizeof(1)
24
>>> sys.getsizeof(2 ** 62)
24
>>> sys.getsizeof(2 ** 63)
36

在 Python 3 中,我认为总体情况是一样的,但整数的大小以更零碎的方式增加:

>>> sys.getsizeof(0)
24
>>> sys.getsizeof(1)
28
>>> sys.getsizeof(2 ** 30 - 1)
28
>>> sys.getsizeof(2 ** 30)
32
>>> sys.getsizeof(2 ** 60 - 1)
32
>>> sys.getsizeof(2 ** 60)
36

当然,这些结果都取决于硬件! YMMV。

Python 3 中整数大小的可变性暗示它们的行为可能更像可变长度类型(如列表)。事实上,事实证明这是真的。这是 Python 3 中 int 对象的 C struct 的定义:

struct _longobject {
    PyObject_VAR_HEAD
    digit ob_digit[1];
};

伴随此定义的 comments 总结了 Python 3 的整数表示。零不是由存储值表示,而是由大小为零的对象表示(这就是为什么sys.getsizeof(0)24 字节,而sys.getsizeof(1)28)。负数由具有负大小属性的对象表示!好诡异。

【讨论】:

  • 谢谢!但我的系统返回 12 的大小。是字节吗?如果以字节为单位,则比我想象的要大,如果以位为单位,则不合理......
  • @HailiangZhang,这是 12 个字节——在我的例子中是 24 个字节。 Python int 与(例如)c 中的 int 非常不同。在 Python 中,int 是一个成熟的对象。这意味着有额外的开销。有关 (cpython) int 内部的相当详细的讨论,请参阅 here
  • @HailiangZhang,另外,this 描述了您在上面链接的页面中看到的 PyObject_HEAD 宏的结构。除了其他存储之外,每个 Python 对象都至少包含一个引用计数和对该对象类型的引用。
  • 如果要存储大量紧凑存储的 32 位(或更少位)整数,请参阅array 模块。
  • 请注意,结果为 24 只为 0(这是 int() 返回的值)。试试sys.getsizeof(1),你会得到 28。
猜你喜欢
  • 1970-01-01
  • 2020-09-21
  • 1970-01-01
  • 2020-10-31
  • 1970-01-01
  • 2016-07-09
  • 1970-01-01
  • 2021-03-02
  • 1970-01-01
相关资源
最近更新 更多