【发布时间】:2021-01-05 01:42:33
【问题描述】:
我正在玩 GPT2,我有 2 个张量:
O:形状为 (B, S-1, V) 的输出张量,其中 B 是批量大小 S 是时间步数,V 是词汇量。这是生成模型的输出,并沿第二维进行了 softmax。
L:一个 2D 张量形状 (B, S-1),其中每个元素是每个样本的每个时间步长的正确标记的索引。这基本上是标签。
我想根据张量 L 从张量 O 中提取相应正确标记的预测概率,这样我最终将得到一个二维张量形状 (B, S)。除了使用循环之外,还有其他有效的方法吗?
【问题讨论】:
-
你能添加样本张量和预期输出吗?
标签: nlp pytorch huggingface-transformers