你有这个错误:
zlib.error: Error -3 while decompressing: incorrect header check
这很可能是因为您正在尝试检查不存在的标题,例如您的数据遵循RFC 1951(deflate 压缩格式)而不是RFC 1950(zlib 压缩格式)或RFC 1952(gzip 压缩格式)。
选择窗口位
但是zlib 可以解压所有这些格式:
- 要(去)压缩
deflate 格式,使用wbits = -zlib.MAX_WBITS
- 要(去)压缩
zlib 格式,使用wbits = zlib.MAX_WBITS
- 要(去)压缩
gzip 格式,使用wbits = zlib.MAX_WBITS | 16
参见http://www.zlib.net/manual.html#Advanced 中的文档(inflateInit2 部分)
示例
测试数据:
>>> deflate_compress = zlib.compressobj(9, zlib.DEFLATED, -zlib.MAX_WBITS)
>>> zlib_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS)
>>> gzip_compress = zlib.compressobj(9, zlib.DEFLATED, zlib.MAX_WBITS | 16)
>>>
>>> text = '''test'''
>>> deflate_data = deflate_compress.compress(text) + deflate_compress.flush()
>>> zlib_data = zlib_compress.compress(text) + zlib_compress.flush()
>>> gzip_data = gzip_compress.compress(text) + gzip_compress.flush()
>>>
zlib 的明显测试:
>>> zlib.decompress(zlib_data)
'test'
测试deflate:
>>> zlib.decompress(deflate_data)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(deflate_data, -zlib.MAX_WBITS)
'test'
测试gzip:
>>> zlib.decompress(gzip_data)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
zlib.error: Error -3 while decompressing data: incorrect header check
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|16)
'test'
数据还兼容gzip模块:
>>> import gzip
>>> import StringIO
>>> fio = StringIO.StringIO(gzip_data) # io.BytesIO for Python 3
>>> f = gzip.GzipFile(fileobj=fio)
>>> f.read()
'test'
>>> f.close()
自动标头检测(zlib 或 gzip)
将32 添加到windowBits 将触发标头检测
>>> zlib.decompress(gzip_data, zlib.MAX_WBITS|32)
'test'
>>> zlib.decompress(zlib_data, zlib.MAX_WBITS|32)
'test'
改用gzip
或者你可以忽略zlib,直接使用gzip模块;但是please remember that under the hood、gzip 使用zlib。
fh = gzip.open('abc.gz', 'rb')
cdata = fh.read()
fh.close()