【发布时间】:2014-07-02 16:43:58
【问题描述】:
每次我使用 urllib2、requests、pycurl 等标准库时,我都没有获得完整的源代码。如何获得完整的源代码,就像我从 chrome、firefox 等查看它一样。 我正在尝试这样做:
def go_to(link):
headers = {'User-Agent': USER_AGENT,
'Accept': ACCEPT,
'Accept-Encoding': ACCEPT_ENCODING,
'Accept-Language': ACCEPT_LANGUAGE,
'Cache-Control': CACHE_CONTROL,
'Connection': CONNECTION,
'Host': HOST}
req = urllib2.Request(link, None, headers)
response = urllib2.urlopen(req)
return response.read()
谢谢!
对不起,我的英语不好。
统一更新: 这是来自浏览器的完整代码:
<td colspan="1"><font class="spy1">1</font> <font class="spy14">192.3.10.113<script type="text/javascript">document.write("<font class=spy2>:<\/font>"+(TwoFiveFiveSix^OneOneSix)+(Zero0FourFour^ZeroSevenSeven)+(TwoFiveFiveSix^OneOneSix)+(TwoFiveFiveSix^OneOneSix))</script><font class="spy2">:</font>8088</font></td>
这不是我脚本中的完整代码:
<font class="spy14">192.3.10.113<script type="text/javascript">document.write("<font class=spy2>:<\/font>"+(Eight7FiveSix^Seven1One)+(FiveZeroTwoOne^Two3Zero)+(Eight7FiveSix^Seven1One)+(Eight7FiveSix^Seven1One))</script></font>
【问题讨论】:
-
你能解释一下你收到的是“不是完整的源代码”吗? (请注意,在浏览器中查看 HTML 会显示浏览器对其的解释)
-
你得到了什么?它和你想要的有什么不同?
标签: python html browser request