【发布时间】:2016-03-26 13:45:37
【问题描述】:
我有一个 7GB 的 .tgz 文件,其中包含我想在 Python 中处理的数千张高分辨率照片。对于单个图像,我可以执行以下所有操作,但我不确定如何处理如此大的数据和 .tgz 文件格式。我用谷歌搜索过,但也许我没有使用最好的搜索词。显式代码对我理解最有帮助。
如何将此 .tgz 数据加载到 Python 中? (pickle、numpy、tarfile?pip install tarfile 失败。)我最终希望将它们转换为 numpy 数组。
如何将所有图像设置为设定的分辨率?
如何将所有图像转换为灰度?
目标是处理用于卷积神经网络 (CNN) 的数据。
【问题讨论】:
-
虽然,这并不完全是一个答案,更多的是一个建议:如果您需要处理数据,也许值得先将数据解包一次,然后多次处理解包后的图像。
标签: python numpy image-processing tar