【发布时间】:2015-09-01 20:16:32
【问题描述】:
我在使用 Python Requests 或 urllib2 打开 url 时遇到了一种情况。我收到了 404“找不到页面”的回复。例如,url = 'https://www.facebook.com/mojombo'。但是,我可以将这些网址复制并粘贴到浏览器中并访问它们。为什么会这样?
我需要从这些页面的 html 源代码中获取一些内容。由于我无法使用 Requests 或 urllib2 打开这些 url,因此我无法使用 BeautifulSoup 从 html 源代码中提取元素。有没有办法使用 Python 获取这些页面的源代码并从中提取内容?
虽然这是一个普遍的问题,但我仍然需要一些工作代码来解决它。谢谢!
【问题讨论】:
-
很可能,您需要登录 Facebook 才能查看该页面。我没有登录,我也得到 404。
标签: python beautifulsoup http-status-code-404 urllib2 python-requests