【发布时间】:2012-11-10 17:06:44
【问题描述】:
我正在尝试从 http://book.libertorrent.com/ 获取数据,但目前我失败了,因为响应中出现了一些额外的数据(标题)。我的代码很简单:
response = urllib.urlopen('http://book.libertorrent.com/login.php')
f = open('someFile.html', 'w')
f.write(response.read())
read() 返回:
Date: Fri, 09 Nov 2012 07:36:54 GMT
Content-Type: text/html; charset=utf-8
Transfer-Encoding: chunked
Connection: close
Cache-Control: no-cache, pre-check=0, post-check=0
Expires: 0
Pragma: no-cache
Set-Cookie: bb_test=973132321; path=/; domain=book.libertorrent.com
Content-Language: ru
1ec0
...Html...
0
而 response.info() 为空。
有什么方法可以纠正反应吗?
【问题讨论】:
-
在 response.read() 之后,response.getcode() 说了什么?在我的 Mac 上,response.read() 返回 html,而 .getcode() 返回 200,这没问题(成功)。
-
您的方法通常有效;当我在那个网站上尝试时,我遇到了同样的问题......
-
我也是,有趣的是它适用于 Python 3。