【问题标题】:Python web scraping with requests and beautiful soup blocked by needing javascriptPython web 抓取请求和美丽的汤被需要 javascript 阻止
【发布时间】:2020-12-18 17:15:40
【问题描述】:

我正在尝试从网站上抓取文本。我使用简单的代码:requests.get(url_here)。我的代码直到最近才有效。现在,当我使用请求时,我收到一条消息,而不是获取网站的文本:

“该网站需要启用 JavaScript!您使用的浏览器不支持 JavaScript,或者 JavaScript 已关闭。”

我已验证我的浏览器确实启用了 javascript。有没有办法解决这个问题?

在 Mac 上使用 Jupyter notebook 在 Python 中工作,供参考。

【问题讨论】:

  • 你需要像 Selenium 这样的 javascript。 requests 模块不执行 javascript。或者,您可以尝试查找 javascript 进行的 AJAX 调用,然后使用请求复制该 AJAX 调用。如果网址不保密,请分享网址。
  • 使用请求访问此网页几个月来完美运行。据我所知,网站上没有任何改变会使请求不再有效。这些信息有帮助吗?
  • "该站点需要启用 JavaScript!您使用的浏览器不支持 JavaScript,或者 JavaScript 已关闭。"即使外观可能没有改变,也表明某些东西已经改变了。尝试在关闭 javascript 的情况下在浏览器中打开页面。

标签: javascript python jupyter scrape


【解决方案1】:

这是我写的一篇小文章。这是 BookMyShow 网站的一个非常基本的网络抓取。我希望它对你有用。

Introduction to Web Scraping

【讨论】:

    猜你喜欢
    • 2019-05-05
    • 1970-01-01
    • 1970-01-01
    • 2016-05-19
    • 2021-03-30
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多