【发布时间】:2021-10-13 23:35:14
【问题描述】:
我正在尝试在 pytorch 模型中定义一组新参数 B。我想用模型W的当前权重初始化新参数。
问题:我希望这些参数 B 是可区分的,但 autograd 不应该将它们的历史跟踪到 W(所以 B 应该有一个新的内存,而不是参考 @987654326 @)。正确的函数是什么?
我了解B = W.clone() 会在区分时导致 B 到 W 的 autograd 跟踪历史记录。我也知道B = W.detach().clone() 是不可区分的。
编辑:
我相信B = nn.Parameter(W.detach().clone()) 应该是正确的函数。这是正确的吗?如果是,这是最简单的函数吗?
【问题讨论】:
-
“希望参数
B可区分”是什么意思?你的意思是应该为它们计算梯度吗? -
@akshayk07 应该是可计算的。
标签: pytorch