【发布时间】:2011-10-21 15:00:00
【问题描述】:
我正在尝试使用 urllib2 和 BeautifulSoup 抓取网站 http://www.nseindia.com。不幸的是,当我尝试通过 Python 访问该页面时,我不断收到 403 Forbidden。我认为这是一个用户代理问题,但改变它并没有帮助。然后我认为它可能与cookie有关,但显然通过关闭cookie的链接加载页面工作正常。什么可能会阻止通过 urllib 的请求?
【问题讨论】:
标签: python urllib2 web-scraping