【发布时间】:2017-01-04 17:32:33
【问题描述】:
我正在尝试使用 Python 的 urllib.request 下载一些内容。以下命令产生异常:
import urllib.request
print(urllib.request.urlopen("https://fpgroup.foreignpolicy.com/foreign-policy-releases-mayjune-spy-issue/").code)
结果:
...
HTTPError: HTTP Error 403: Forbidden
如果我使用 firefox 或链接(命令行浏览器),我会得到内容和状态码 200。如果我使用 lynx,很奇怪,我也会得到 403。
我希望所有方法都有效
- 同样的方式
- 成功
为什么不是这样?
【问题讨论】:
-
也许该网站通过检查标题信息和所有这些东西来阻止人们进行抓取。试试设置?
-
@MooingRawr:就是这样......请回答。
-
还有:他们想避开谁?即使是像我这样自己不明白的人,也知道如何使用互联网......
-
回答了你的两个cmets
标签: python urllib http-status-code-403