【发布时间】:2024-01-19 23:54:01
【问题描述】:
我需要一组图像的视觉特征才能嵌入输入图像。我需要的维度是128。
我想过移除预训练模型(例如 ResNet50)的最后一层,而不是用扁平层替换最后一个全连接层,并对每个图像进行前向传递。问题是,在展平层之后 ResNet50 会给你一个 512 暗淡的特征向量。如果我添加另一个输出昏暗为 128 的全连接层,我需要重新训练和微调网络,因为我正在添加新参数。
有没有什么方法可以在不添加可学习参数的情况下,从最后一层512 dim特征向量得到128 dim特征向量?
【问题讨论】:
标签: deep-learning neural-network pytorch conv-neural-network feature-extraction