【问题标题】:gzipped data "not a gzipped file", but I think it isgzipped 数据“不是 gzipped 文件”,但我认为它是
【发布时间】:2016-06-22 00:44:10
【问题描述】:

这个:

H4sIAAAAAAAEAO29B2AcSZYlJi9tynt/SvVK1+B0oQiAYBMk2JBAEOzBiM3mkuwdaUcjKasqgcplVmVdZhZAzO2dvPfee++999577733ujudTif33/8/XGZkAWz2zkrayZ4hgKrIHz9+fB8/Ih7/Hu8WZXqZ101RLT/7aHe881GaL6fVrFhefPbRuj3fPvjo9zh63FTZ6tHp8jIvq1We0ivL5hE+++yjeduuHt2920zn+SJrxvQVPh9X9cVd/HI315fufqSvvWsK+9bV1dX46h433tvZ2b37e3/x/DUD2i6WTZstp7l7a3bzWx8pok+q2fXR45N5trzIn+fLi3b+1bJoX+XNqlo2in4ILZ80eX1ZTPPfe/zi9M1dAhR5e122R7ufjnce3tvff3x3oEH0C+6XvvKwk98NSY/+H/eQC6mIAQAA

...是来自 Web 服务的 HTTP 响应的压缩后的正文。我想在 Python 脚本中解压缩它,所以我使用了与此处之前的帖子中显示的代码类似的一段代码,例如 Decompressing a gzipped payload of a packet with Python

这是我的脚本:

#!/usr/bin/env python
import logging
import gzip
import StringIO

logging.basicConfig(filename='out.log', level=logging.DEBUG)

compressed_data = 'H4sIAAAAAAAEAO29B2AcSZYlJi9tynt/SvVK1+B0oQiAYBMk2JBAEOzBiM3mkuwdaUcjKasqgcplVmVdZhZAzO2dvPfee++999577733ujudTif33/8/XGZkAWz2zkrayZ4hgKrIHz9+fB8/Ih7/Hu8WZXqZ101RLT/7aHe881GaL6fVrFhefPbRuj3fPvjo9zh63FTZ6tHp8jIvq1We0ivL5hE+++yjeduuHt2920zn+SJrxvQVPh9X9cVd/HI315fufqSvvWsK+9bV1dX46h433tvZ2b37e3/x/DUD2i6WTZstp7l7a3bzWx8pok+q2fXR45N5trzIn+fLi3b+1bJoX+XNqlo2in4ILZ80eX1ZTPPfe/zi9M1dAhR5e122R7ufjnce3tvff3x3oEH0C+6XvvKwk98NSY/+H/eQC6mIAQAA'

logging.debug(compressed_data)

buf = StringIO.StringIO(compressed_data)
f = gzip.GzipFile(fileobj=buf)
decompressed_data = f.read()

logging.debug(decompressed_data)

...但是当我运行它时,Python 报告它不是一个 gzip 压缩文件。

我很确定,因为当我使用this online gzip/gunzip utility 时,字符串已正确解压缩。 HTTP 响应标头还表示它是 gzip 编码的。而且,当我使用测试工具调用服务时,我还可以看到解码后的内容。

我很想知道我在这里省略了什么。

作为参考,解压后的字符串应该是:

<?xml version="1.0" encoding="utf-8"?><soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema"><soap:Body><ChangeLengthUnitResponse xmlns="http://www.webserviceX.NET/"><ChangeLengthUnitResult>16.09344</ChangeLengthUnitResult></ChangeLengthUnitResponse></soap:Body></soap:Envelope>

我使用的是 Python 2.7.11。

【问题讨论】:

  • 这是 base64 编码的数据。也许它是一个 base64 编码的 gzip 文件,但您首先需要对其进行 base64 解码,然后才能对其进行压缩。
  • 是的,我想说的是,如果都是 ASCII,那不可能是 gzip 数据。

标签: python gzip


【解决方案1】:

使用@Rhymoid 的建议,

这是 base64 编码的数据。也许它是一个 base64 编码的 gzip 文件,但您首先需要对其进行 base64 解码,然后才能对其进行压缩。

您的代码应如下所示:

#!/usr/bin/env python
import logging
import gzip 
import StringIO
from base64 import b64decode

logging.basicConfig(filename='out.log', level=logging.DEBUG)

compressed_data = 'H4sIAAAAAAAEAO29B2AcSZYlJi9tynt/SvVK1+B0oQiAYBMk2JBAEOzBiM3mkuwdaUcjKasqgcplVmVdZhZAzO2dvPfee++999577733ujudTif33/8/XGZkAWz2zkrayZ4hgKrIHz9+fB8/Ih7/Hu8WZXqZ101RLT/7aHe881GaL6fVrFhefPbRuj3fPvjo9zh63FTZ6tHp8jIvq1We0ivL5hE+++yjeduuHt2920zn+SJrxvQVPh9X9cVd/HI315fufqSvvWsK+9bV1dX46h433tvZ2b37e3/x/DUD2i6WTZstp7l7a3bzWx8pok+q2fXR45N5trzIn+fLi3b+1bJoX+XNqlo2in4ILZ80eX1ZTPPfe/zi9M1dAhR5e122R7ufjnce3tvff3x3oEH0C+6XvvKwk98NSY/+H/eQC6mIAQAA'

logging.debug(compressed_data)

buf = StringIO.StringIO(b64decode(compressed_data))
f = gzip.GzipFile(fileobj=buf)
decompressed_data = f.read()

logging.debug(decompressed_data)

base64.b64decode 方法将返回解码后的字符串。

【讨论】:

  • @It'sMojitoTime 实际上应该在响应中包含一个 HTTP 标头,告诉您它是 base64。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2012-01-11
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-10-28
  • 1970-01-01
  • 2018-09-09
相关资源
最近更新 更多