【问题标题】:Different filesizes for images generated using octave and python使用 octave 和 python 生成的图像的不同文件大小
【发布时间】:2017-07-11 15:16:40
【问题描述】:

我正在使用python(scikit-image)和octave生成200张图片如下

Python3

import numpy as np
from skimage.io import imsave

images = [255*np.ones((100,100), dtype=np.uint8),  # white
             np.zeros((100,100), dtype=np.uint8)]  # black

for i in range(200): # save alternating black and white images
    imsave('%04d.png'%(i+1), images[i%2])

八度

pkg load image;

im1 = 255*ones(100,100); # white
im2 = zeros(100,100);    # black
for i=1:200
    name = sprintf('%04d.png', i);
    if mod(i,2) == 0
        imwrite(im1, name);
    else
        imwrite(im2, name);
    end
end

接下来,我使用 ffmpeg 使用以下命令从这两组图像中生成两个视频(交替的白色和黑色帧)

ffmpeg -r 10 -loglevel quiet \
       -i ./%04d.png -c:v libx264 \
       -preset ultrafast -crf 0 ./out.mkv
  1. 这两种代码生成的图像文件大小不同。
  • 八度{白色:192 字节,黑色:98 字节}
  • Python {白色:120 字节,黑色:90 字节}
  1. 从这些 octave 和 python 图像生成的视频文件的大小彼此之间存在显着差异。
  • 八度{文件大小:60 KB}
  • Python {文件大小:116 KB}

为什么我们会有这种明显非常奇怪的行为?

编辑

由于有人建议该行为可能是由于 octave 和 python 使用不同的位深度来存储图像,我将 octave 代码更改为使用 8 位数字

im1 = uint8(255*ones(100,100)); # white
im2 = uint8(zeros(100,100));    # black

现在图像文件大小几乎相同

  • 八度{白色:118 字节,黑色:90 字节}
  • Python {白色:120 字节,黑色:90 字节}

但是视频文件的问题还是一样,octave: 60K, python: 116K

【问题讨论】:

    标签: python matlab ffmpeg octave scikit-image


    【解决方案1】:

    scikit-image(在底层使用 PIL)将 PNG 保存为 8 位格式,而 octave 使用 16 位(如下面@carandraug 所述,这是因为浮点数据是在 Octave 中提供的,PNG 确实如此不直接支持,所以数据转为uint16)。仅此一项就可以解释大小的差异(尽管它们的编码器工作方式可能存在其他细微差异)。

    scikit 图像:

    $ identify 000*.png
    0001.png PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000
    0002.png[1] PNG 100x100 100x100+0+0 8-bit RGB 256c 90B 0.000u 0:00.000
    0003.png[2] PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000
    0004.png[3] PNG 100x100 100x100+0+0 8-bit RGB 256c 90B 0.000u 0:00.000
    0005.png[4] PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000
    0006.png[5] PNG 100x100 100x100+0+0 8-bit RGB 256c 90B 0.000u 0:00.000
    0007.png[6] PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000
    0008.png[7] PNG 100x100 100x100+0+0 8-bit RGB 256c 90B 0.000u 0:00.000
    0009.png[8] PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000
    

    八度:

    $ identify 000*.png
    0001.png PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000
    0002.png[1] PNG 100x100 100x100+0+0 16-bit RGB 192B 0.000u 0:00.000
    0003.png[2] PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000
    0004.png[3] PNG 100x100 100x100+0+0 16-bit RGB 192B 0.000u 0:00.000
    0005.png[4] PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000
    0006.png[5] PNG 100x100 100x100+0+0 16-bit RGB 192B 0.000u 0:00.000
    0007.png[6] PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000
    0008.png[7] PNG 100x100 100x100+0+0 16-bit RGB 192B 0.000u 0:00.000
    0009.png[8] PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000
    

    在我的机器上(ffmpeg 2.8.11-0ubuntu0.16.04.1),两个视频最终都是 116KB。

    【讨论】:

    • 您能否提供一些有关您的系统和您正在使用的 ffmpeg 版本的详细信息?
    • "而 octave 使用 16 位。"没那么简单。在 OP 问题中,他从未像在 python 代码中那样将数据转换为 uint8。因此,数据属于 double 类,但由于请求了 png 格式(不支持浮点像素值),它被转换为 16 位(我相信这取决于 graphicsmagick 构建选项)。
    猜你喜欢
    • 2014-06-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-02-18
    • 2016-11-16
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多