使用 octave 和 python 生成的图像的不同文件大小答案

【问题标题】：Different filesizes for images generated using octave and python使用 octave 和 python 生成的图像的不同文件大小
【发布时间】：2017-07-11 15:16:40
【问题描述】：

我正在使用python（scikit-image）和octave生成200张图片如下

Python3

import numpy as np
from skimage.io import imsave

images = [255*np.ones((100,100), dtype=np.uint8),  # white
             np.zeros((100,100), dtype=np.uint8)]  # black

for i in range(200): # save alternating black and white images
    imsave('%04d.png'%(i+1), images[i%2])

八度

pkg load image;

im1 = 255*ones(100,100); # white
im2 = zeros(100,100);    # black
for i=1:200
    name = sprintf('%04d.png', i);
    if mod(i,2) == 0
        imwrite(im1, name);
    else
        imwrite(im2, name);
    end
end

接下来，我使用 ffmpeg 使用以下命令从这两组图像中生成两个视频（交替的白色和黑色帧）

ffmpeg -r 10 -loglevel quiet \
       -i ./%04d.png -c:v libx264 \
       -preset ultrafast -crf 0 ./out.mkv

这两种代码生成的图像文件大小不同。

八度{白色：192 字节，黑色：98 字节}
Python {白色：120 字节，黑色：90 字节}

从这些 octave 和 python 图像生成的视频文件的大小彼此之间存在显着差异。

八度{文件大小：60 KB}
Python {文件大小：116 KB}

为什么我们会有这种明显非常奇怪的行为？

编辑

由于有人建议该行为可能是由于 octave 和 python 使用不同的位深度来存储图像，我将 octave 代码更改为使用 8 位数字

im1 = uint8(255*ones(100,100)); # white
im2 = uint8(zeros(100,100));    # black

现在图像文件大小几乎相同

八度{白色：118 字节，黑色：90 字节}
Python {白色：120 字节，黑色：90 字节}

但是视频文件的问题还是一样，octave: 60K, python: 116K

【问题讨论】：

标签： python matlab ffmpeg octave scikit-image

【解决方案1】：

scikit-image（在底层使用 PIL）将 PNG 保存为 8 位格式，而 octave 使用 16 位（如下面@carandraug 所述，这是因为浮点数据是在 Octave 中提供的，PNG 确实如此不直接支持，所以数据转为uint16）。仅此一项就可以解释大小的差异（尽管它们的编码器工作方式可能存在其他细微差异）。

scikit 图像：

$ identify 000*.png
0001.png PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000
0002.png[1] PNG 100x100 100x100+0+0 8-bit RGB 256c 90B 0.000u 0:00.000
0003.png[2] PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000
0004.png[3] PNG 100x100 100x100+0+0 8-bit RGB 256c 90B 0.000u 0:00.000
0005.png[4] PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000
0006.png[5] PNG 100x100 100x100+0+0 8-bit RGB 256c 90B 0.000u 0:00.000
0007.png[6] PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000
0008.png[7] PNG 100x100 100x100+0+0 8-bit RGB 256c 90B 0.000u 0:00.000
0009.png[8] PNG 100x100 100x100+0+0 8-bit RGB 256c 120B 0.000u 0:00.000

八度：

$ identify 000*.png
0001.png PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000
0002.png[1] PNG 100x100 100x100+0+0 16-bit RGB 192B 0.000u 0:00.000
0003.png[2] PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000
0004.png[3] PNG 100x100 100x100+0+0 16-bit RGB 192B 0.000u 0:00.000
0005.png[4] PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000
0006.png[5] PNG 100x100 100x100+0+0 16-bit RGB 192B 0.000u 0:00.000
0007.png[6] PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000
0008.png[7] PNG 100x100 100x100+0+0 16-bit RGB 192B 0.000u 0:00.000
0009.png[8] PNG 100x100 100x100+0+0 16-bit RGB 98B 0.000u 0:00.000

在我的机器上（ffmpeg 2.8.11-0ubuntu0.16.04.1），两个视频最终都是 116KB。

【讨论】：

您能否提供一些有关您的系统和您正在使用的 ffmpeg 版本的详细信息？
"而 octave 使用 16 位。"没那么简单。在 OP 问题中，他从未像在 python 代码中那样将数据转换为 uint8。因此，数据属于 double 类，但由于请求了 png 格式（不支持浮点像素值），它被转换为 16 位（我相信这取决于 graphicsmagick 构建选项）。