【发布时间】:2014-06-03 15:07:06
【问题描述】:
打印的 html 返回乱码...而不是我期望在浏览器的“查看源代码”中看到的内容。
这是为什么呢?如何轻松解决?
感谢您的帮助。
使用 mechanize、curl 等实现相同的行为。
import urllib
import urllib2
start_url = "http://www.ncert.nic.in/ncerts/textbook/textbook.htm"
response = urllib2.urlopen(start_url)
html = response.read()
print html
【问题讨论】:
-
我无法复制这个。在您的上下文中,“乱码”是什么意思?我得到的 html 完全符合我的预期。
标签: python html urllib2 mechanize-python