Phototour 数据集的平均值和标准差的计算答案

【问题标题】：Calculation of Mean and Std of Phototour datasetPhototour 数据集的平均值和标准差的计算
【发布时间】：2021-04-08 08:59:00
【问题描述】：

我有一个关于 Phototour 数据集的 Mean 和 Std 计算的问题。

Phototour 数据集提供了对应的各种形状的补丁 (64,64,1) 来训练一个描述符（通常是 CNN 网络）。这些补丁是从原始图像中提取的。这些原始图像是由来自世界各地的游客以不同的图像分辨率从特定地点（Notredame、Liberty、Yosemite）拍摄的。每个补丁（32, 32）的中心是 SIFT 检测器检测到的关键点。例如，在这些数据集中，我们从 Notredame 的 715 张图像中提取了近 50 万个补丁。

数据集的链接： http://phototour.cs.washington.edu/

在 Pytorch Phototour 数据集中，他们定义如下：

means = {'notredame': 0.4854, 'yosemite': 0.4844, 'liberty': 0.4437,
         'notredame_harris': 0.4854, 'yosemite_harris': 0.4844, 'liberty_harris': 0.4437}
stds = {'notredame': 0.1864, 'yosemite': 0.1818, 'liberty': 0.2019,
        'notredame_harris': 0.1864, 'yosemite_harris': 0.1818, 'liberty_harris': 0.2019}

如何重现这两个参数？
我必须计算提取的补丁或原始图像的平均值和标准差吗？

任何帮助将不胜感激。

【问题讨论】：

能否请您详细说明minimal reproducible example？
提取的补丁是什么意思？
是的，当然@LazyCoder。我已经用额外的解释编辑了帖子。
@Ivan 我已经编辑了帖子，但此外，每个补丁都是从图像中提取的。补丁中心 (32, 32) 是 SIFT 检测器检测到的关键点。在这些数据集中，我们从 715 张图像中提取了近 50 万个补丁。

标签： python pytorch dataset std mean

【解决方案1】：

通常，您会测量训练集的均值和标准差。您通常必须同时测量每个功能（或通道：这里只有一个通道）。这里 Notre Dame、Yosemite 和 Liberty 在某种程度上被视为三个独立的数据集：

按照下面的链接为 3 个数据集下载 zip 文件

此外，它对应于提取的补丁的均值/标准是有意义的。因为torchvision.datasets.PhotoTour 是包含与论文相关的 16x16-patch 网格的数据集Learning Local Image Descriptors Data [1]。

[1]：S. Winder 和 M. Brown。学习本地图像描述符。参加计算机视觉和模式识别国际会议（CVPR2007）

【讨论】：

感谢您的回答。所以你的意思是计算提取补丁的均值和标准差？
是的，如果您想使用此数据集并希望自己测量值。
请在 pytorch 官方实现中查看 Notredame 数据集的平均值：'notredame'：0.4854 和 'notredame_harris'：0.4854。这两个数据集来自同一位置，但它们具有完全不同的补丁。那么为什么它们的平均值相等呢？