【问题标题】:Open Source Methods to Block Selenium-based bots from websites阻止网站上基于 Selenium 的机器人的开源方法
【发布时间】:2020-10-16 05:32:25
【问题描述】:

我正在创建一个网站,该网站可能会受到 cmets 或电子邮件中的拖钓机器人的大量关注。

最常见的机器人框架之一似乎是Selenium

如何检测和阻止基于 Selenium 的机器人?我更喜欢开源框架,以便我可以实时更新代码。该网站基本上使用托管在 Apache 上的 JavaScript、HTML5 和 CSS。

【问题讨论】:

    标签: selenium security selenium-webdriver bots websecurity


    【解决方案1】:

    在提交评论或电子邮件之前要求 Google 重新验证会非常有效。

    https://www.google.com/recaptcha/intro/v3.html

    【讨论】:

      【解决方案2】:

      你没看错。如今,最常见和流行的 框架之一是基于Selenium 驱动的WebDriver

      但是,Selenium 驱动的 WebDriver 控制的浏览上下文很容易检测,并且可以通过以下不同方式实施纠正措施:

      您可以在How does recaptcha 3 know I'm using selenium/chromedriver?找到相关的详细讨论

      • headless Chrome UserAgent 中检测到术语 HeadlessChrome

      您可以在Access Denied page with headless Chrome on Linux while headed Chrome works on windows using Selenium through Python找到相关的详细讨论

      您可以在Unable to use Selenium to automate Chase site login找到相关的详细讨论

      • 使用来自AkamaiBot Manager 服务

      您可以在Dynamic dropdown doesn't populate with auto suggestions on https://www.nseindia.com/ when values are passed using Selenium and Python找到相关的详细讨论

      • 使用来自DatadomeBot Protection 服务

      您可以在Website using DataDome gets captcha blocked while scraping using Selenium and Python找到相关的详细讨论


      参考文献

      您可以在以下位置找到相关讨论:

      【讨论】:

        猜你喜欢
        • 2014-07-01
        • 1970-01-01
        • 2011-01-07
        • 2021-04-15
        • 2014-04-03
        • 2022-10-30
        • 1970-01-01
        • 2012-04-09
        • 2020-07-20
        相关资源
        最近更新 更多