【问题标题】:Why is dataclasses.astuple returning a deepcopy of class attributes?为什么 dataclasses.astuple 返回类属性的深层副本?
【发布时间】:2019-01-18 23:46:04
【问题描述】:

在下面的代码中,astuple 函数正在执行数据类的类属性的深层复制。为什么它不会产生与函数my_tuple 相同的结果?

import copy
import dataclasses


@dataclasses.dataclass
class Demo:
    a_number: int
    a_bool: bool
    classy: 'YOhY'

    def my_tuple(self):
        return self.a_number, self.a_bool, self.classy

class YOhY:
    def __repr__(self):
        return (self.__class__.__qualname__ + f" id={id(self)}")


why = YOhY()
print(why)  # YOhY id=4369078368

demo = Demo(1, True, why)
print(demo)  # Demo(a_number=1, a_bool=True, classy=YOhY id=4369078368)

untrupled = demo.my_tuple()
print(untrupled)  # YOhY id=4369078368

trupled = dataclasses.astuple(demo)
print(trupled)  # YOhY id=4374460064

trupled2 = trupled
print(trupled2)  # YOhY id=4374460064

trupled3 = copy.copy(trupled)
print(trupled3)  # YOhY id=4374460064

trupled4 = copy.deepcopy(trupled)
print(trupled4)  # YOhY id=4374460176

脚注

正如Anthony Sottile's 出色的响应清楚地表明这是编码到 Python 3.7 中的行为。任何希望 astuple 以与 collections.namedtuple 相同的方式解包的人都需要将其替换为类似于 Demo.my_tuple 的方法。以下代码没有 my_tuple 脆弱,因为如果数据类的字段发生更改,则不需要修改。另一方面,如果 __slots__ 正在使用中,它将不起作用。

只要类或其超类中存在__hash__ 方法,这两个版本的代码都会构成威胁。请参阅unsafe_hash 的 Python 3.7 文档,特别是以“以下是管理 __hash__() 方法的隐式创建的规则”开头的两段。

def unsafe_astuple(self):
    return tuple([self.__dict__[field.name] for field in dataclasses.fields(self)])

【问题讨论】:

  • 猜测是为了避免别名问题,因此如果某些代码改变了复制对象中的值,则更改不会反映在数据类中的“原始”对象中。
  • 想知道这个 API 会提供一个参数,这样我们就不会总是深拷贝。

标签: python python-3.x python-dataclasses


【解决方案1】:

这似乎是astupleundocumented 行为(而且asdict 似乎也是如此)。

dataclasses.astuple(*, tuple_factory=tuple)

将数据类instance 转换为元组(通过使用工厂函数tuple_factory)。每个数据类都转换为其字段值的元组。数据类、字典、列表和元组被递归到。

这里是the source

def _asdict_inner(obj, dict_factory):
    if _is_dataclass_instance(obj):
        result = []
        for f in fields(obj):
            value = _asdict_inner(getattr(obj, f.name), dict_factory)
            result.append((f.name, value))
        return dict_factory(result)
    elif isinstance(obj, (list, tuple)):
        return type(obj)(_asdict_inner(v, dict_factory) for v in obj)
    elif isinstance(obj, dict):
        return type(obj)((_asdict_inner(k, dict_factory), _asdict_inner(v, dict_factory))
                          for k, v in obj.items())
    else:
return copy.deepcopy(obj)

这里的 deepcopy 似乎是故意的,但可能应该记录在案。

【讨论】:

  • 行为记录在案;这就是“数据类、字典、列表和元组被递归到”这一行所指的内容。
  • @jwodder 从一致性的角度来看,深度复制所有属性的实现是有意义的——也就是说它没有明确声明非列表/非字典/非元组被深度复制。
猜你喜欢
  • 1970-01-01
  • 2019-04-08
  • 1970-01-01
  • 2014-05-17
  • 2011-07-23
  • 2020-01-18
  • 1970-01-01
  • 2016-07-09
  • 2014-03-19
相关资源
最近更新 更多