【发布时间】:2016-06-22 00:44:10
【问题描述】:
这个:
H4sIAAAAAAAEAO29B2AcSZYlJi9tynt/SvVK1+B0oQiAYBMk2JBAEOzBiM3mkuwdaUcjKasqgcplVmVdZhZAzO2dvPfee++999577733ujudTif33/8/XGZkAWz2zkrayZ4hgKrIHz9+fB8/Ih7/Hu8WZXqZ101RLT/7aHe881GaL6fVrFhefPbRuj3fPvjo9zh63FTZ6tHp8jIvq1We0ivL5hE+++yjeduuHt2920zn+SJrxvQVPh9X9cVd/HI315fufqSvvWsK+9bV1dX46h433tvZ2b37e3/x/DUD2i6WTZstp7l7a3bzWx8pok+q2fXR45N5trzIn+fLi3b+1bJoX+XNqlo2in4ILZ80eX1ZTPPfe/zi9M1dAhR5e122R7ufjnce3tvff3x3oEH0C+6XvvKwk98NSY/+H/eQC6mIAQAA
...是来自 Web 服务的 HTTP 响应的压缩后的正文。我想在 Python 脚本中解压缩它,所以我使用了与此处之前的帖子中显示的代码类似的一段代码,例如 Decompressing a gzipped payload of a packet with Python
这是我的脚本:
#!/usr/bin/env python
import logging
import gzip
import StringIO
logging.basicConfig(filename='out.log', level=logging.DEBUG)
compressed_data = 'H4sIAAAAAAAEAO29B2AcSZYlJi9tynt/SvVK1+B0oQiAYBMk2JBAEOzBiM3mkuwdaUcjKasqgcplVmVdZhZAzO2dvPfee++999577733ujudTif33/8/XGZkAWz2zkrayZ4hgKrIHz9+fB8/Ih7/Hu8WZXqZ101RLT/7aHe881GaL6fVrFhefPbRuj3fPvjo9zh63FTZ6tHp8jIvq1We0ivL5hE+++yjeduuHt2920zn+SJrxvQVPh9X9cVd/HI315fufqSvvWsK+9bV1dX46h433tvZ2b37e3/x/DUD2i6WTZstp7l7a3bzWx8pok+q2fXR45N5trzIn+fLi3b+1bJoX+XNqlo2in4ILZ80eX1ZTPPfe/zi9M1dAhR5e122R7ufjnce3tvff3x3oEH0C+6XvvKwk98NSY/+H/eQC6mIAQAA'
logging.debug(compressed_data)
buf = StringIO.StringIO(compressed_data)
f = gzip.GzipFile(fileobj=buf)
decompressed_data = f.read()
logging.debug(decompressed_data)
...但是当我运行它时,Python 报告它不是一个 gzip 压缩文件。
我很确定,因为当我使用this online gzip/gunzip utility 时,字符串已正确解压缩。 HTTP 响应标头还表示它是 gzip 编码的。而且,当我使用测试工具调用服务时,我还可以看到解码后的内容。
我很想知道我在这里省略了什么。
作为参考,解压后的字符串应该是:
<?xml version="1.0" encoding="utf-8"?><soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema"><soap:Body><ChangeLengthUnitResponse xmlns="http://www.webserviceX.NET/"><ChangeLengthUnitResult>16.09344</ChangeLengthUnitResult></ChangeLengthUnitResponse></soap:Body></soap:Envelope>
我使用的是 Python 2.7.11。
【问题讨论】:
-
这是 base64 编码的数据。也许它是一个 base64 编码的 gzip 文件,但您首先需要对其进行 base64 解码,然后才能对其进行压缩。
-
是的,我想说的是,如果都是 ASCII,那不可能是 gzip 数据。