【问题标题】:Assessing the quality of an image with respect to compression?在压缩方面评估图像的质量?
【发布时间】:2011-05-10 17:29:25
【问题描述】:

我有用于计算机视觉任务的图像。该任务对图像质量很敏感。我想删除低于某个阈值的所有图像,但我不确定是否有任何方法/启发式方法可以自动检测通过 JPEG 严重压缩的图像。有人有想法吗?

【问题讨论】:

  • 您的问题最终解决了吗?看看我更新的答案。我最终在周末实施了它(结合各向异性扩散和 SSIM 方法),它似乎给出了有希望的结果。我使用了各向异性扩散而不是高斯模糊。

标签: compression computer-vision jpeg


【解决方案1】:

图像质量评估是一个快速发展的研究领域。由于您没有提到能够访问原始(未压缩)图像,因此您对无参考图像质量评估感兴趣。这实际上是一个相当困难的问题,但这里有一些要点可以帮助您入门:

  • 既然您提到了 JPEG,JPEG 压缩图像中有两个主要的退化特征:blockingblurring
  • 无参考图像质量评估指标通常会寻找这两个特征
  • 阻塞很容易发现,因为它只出现在宏块边界上。宏块的大小是固定的 - 8x8 或 16x16,具体取决于图像的编码方式
  • 模糊有点困难。这是因为图像中的较高频率已被衰减(移除)。您可以将图像分成块,DCT(离散余弦变换)每个块并查看 DCT 结果的高频分量。如果大多数块缺少高频分量,那么您可能看到的是模糊图像
  • 另一种模糊检测方法是测量图像边缘的平均宽度。对图像进行 Sobel 边缘检测,然后测量边缘每一侧的局部最小值/最大值之间的距离。谷歌搜索 Marziliano 的“A no-reference perceptual blur metric”——这是一种著名的方法。 Debing 的“No Reference Block Based Blur Detection”是一篇更新的论文

无论您使用什么指标,都要考虑如何处理误报/误报。与简单的阈值处理相反,我会使用度量结果对图像进行排序,然后剪掉看起来只包含模糊图像的列表末尾。

如果您的图像集包含相当相似的内容(例如,仅面部),您的任务将会简单得多。这是因为图像质量评估指标 不幸的是,通常会受到图像内容的影响。

Google Scholar 是您真正的朋友。我希望我能给你一个具体的解决方案,但我还没有——如果我这样做了,我会成为一名非常成功的硕士生。

更新:

刚刚想到另一个想法:对于每张图片,用 JPEG 重新压缩图像,并检查重新压缩前后文件大小的变化。如果重新压缩后的文件大小比以前小很多,那么很可能图像没有被严重压缩,因为它有一些重要的细节被重新压缩删除了。否则(重新压缩后的差异很小或文件大小更大)可能是图像被严重压缩。

在重新压缩期间使用质量设置可以让您确定高度压缩的确切含义。

如果您使用的是 Linux,使用 bash 和 imageMagick 的转换实用程序来实现这应该不会太难。

您可以尝试这种方法的其他变体:

  • 不要使用 JPEG 压缩,而是尝试其他形式的降级,例如高斯模糊
  • 不要仅仅比较文件大小,而是尝试一个完整的参考指标,例如SSIM——有一个 OpenCV 实现freely available。其他实现(例如 Matlab、C#)也存在,请四处看看。

告诉我你的情况。

【讨论】:

  • Misha - 我正在查看 SSIM 实现,想知道两个输入图像是什么?一个可能是我想估计压缩率的那个,另一个是什么?或者如何通过比较两张图像来估计质量?
【解决方案2】:

我为一本古书拍摄了许多照片(布局如此相似,每张图片两页),但有些照片非常模糊,以至于无法阅读文字。找了一个现成的批处理脚本,找到了最模糊的一个,但是没找到有用的,所以我用了另外一部分脚本上网(基于ImageMagick,但是已经不行了;我不能检索作者的学分!),用于评估单个图像的模糊程度,对其进行调整,并在整个文件夹中对其进行自动化处理。我在这里上传:

https://gist.github.com/888239

希望它对其他人有用。它适用于 Linux 系统,并使用 ImageMagick(以及一些通常在命令行安装的工具,如 gawk、sort、grep 等)。

【讨论】:

    【解决方案3】:

    一个简单的启发式方法是查看width * height * color depth < sigma * file size。当然,您必须为sigma 确定一个合适的值。 sigma 将取决于您正在查看的图像的预期熵。

    【讨论】:

    • 这仅查看相对于图像尺寸的文件大小。但有些内容比其他内容更易于压缩;因此,一张图片在高压缩率下可能看起来不错,而另一张则不然。
    • 有趣的方法,但我的图像会有很大的熵,所以我需要一个通用的方法。
    猜你喜欢
    • 2020-06-18
    • 2011-04-12
    • 1970-01-01
    • 1970-01-01
    • 2014-03-22
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多