【发布时间】:2018-02-21 21:05:40
【问题描述】:
我正在尝试使用以下方式访问页面
page = urllib2.urlopen(full_url)
soup = BeautifulSoup(page, 'html.parser')
li_post_id = "post-" + str(post_id)
li_soup = soup.find('li', attrs={'id':li_post_id})
这在我的 ubuntu 机器上运行良好,但是在我的 Windows 服务器上运行它时出现 403 Forbidden 错误,所以我认为问题出在用户代理上。
我如何将其更改为 Firefox?我只看过使用请求更改用户代理的教程,但我不想将我的所有代码都更改为此。
【问题讨论】:
-
你在HTTP请求头中设置了
User-Agent,BS与它无关。 -
如前所述,BeautifulSoup 根本不与 HTTP 请求交互。你真正想知道的(我相信)是如何使用 urllib2 来做到这一点。我编辑了您的问题以反映这一点。
标签: python python-2.7 user-agent