【发布时间】:2011-11-06 01:45:36
【问题描述】:
这是我的代码,你们也可以测试一下。我总是得到混乱的字符而不是页面源。
Header = {"User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.9.2.8) Gecko/20100722 Firefox/3.6.8 GTB7.1 (.NET CLR 3.5.30729)"}
Req = urllib2.Request("http://rlslog.net", None, Header)
Response = urllib2.urlopen(Req)
Html = Response.read()
print Html[:1000]
通常Html 应该是页面源,但它最终是大量混乱的字符。有人知道为什么吗?
顺便说一句:我在 python 2.7 上
【问题讨论】:
-
对我来说很好,问题一定出在其他地方。也许你输出响应的方式有一些简单的错误?
-
@kapep:你确定吗?我只是简单地“打印 Html[:100]”,它们都搞砸了。你用的是什么python版本?
-
这只是一个疯狂的猜测,因为打印部分不包括在内。按预期工作。使用 2.6.4。
-
@kapep:现在突然出现,一切正常!相同的代码,没有任何改变。哦,伙计,我很困惑......
-
@Shane: "什么都没有改变":在你这边没有,但可能在服务器端发生了一些变化。