【发布时间】:2023-03-09 02:34:01
【问题描述】:
我想访问一个特定的网站,但它以某种方式被阻止,因为它在其他网站上运行得很好。 这是我当前的代码:
from urllib.request import Request, urlopen
my_url = "https://www.whoscored.com/Statistics"
req = Request(my_url, headers={'User-Agent': 'Mozilla/5.0'})
page = urlopen(req).read()
这是我得到的错误:
File "C:\Program Files\Python36\lib\urllib\request.py", line 650, in
http_error_default
raise HTTPError(req.full_url, code, msg, hdrs, fp)
urllib.error.HTTPError: HTTP Error 403: Forbidden
如您所见,我正在使用标题。还有其他方法可以用来绕过阻塞吗? 提前致谢。
【问题讨论】:
-
尝试伪造
user-agent -
我得到了解决方案,它包括 cookie。我会写一个答案:)
标签: python web-scraping urllib