【发布时间】:2014-10-28 22:46:37
【问题描述】:
我正在尝试在 python 中获取示例页面
import mechanize
def viewpage(url):
browser = mechanize.Browser()
page = browser.open(url)
source_code = page.read()
print source_code
viewpage('https://sama.com/index.php?req=1')
但是每次它都会被重定向到 index2.php(通过来自网络服务器的位置标头),因此例如代码打印来自 index2.php 而不是 index.php 的响应是否有避免这种情况?
【问题讨论】:
-
你只是想抓取网页的源代码?
-
是的,只是为了获取源代码。所以我可以解析它。