【问题标题】:Headless Browser + OCR to solve captchas无头浏览器 + OCR 解决验证码
【发布时间】:2020-12-12 20:41:11
【问题描述】:

我正在尝试在无头浏览器中解决验证码问题。有没有办法将 OCR 与无头浏览器一起使用,或者这不可能?如果有什么东西可以更好地用于无头解决方案,我不会致力于 puppeteer。

我运行了一个简单的 puppeteer 爬虫,它去亚马逊并截取了 4-5 次屏幕截图,但随后出现了一个验证码,所以我试图弄清楚如何将 OCR 集成到 headless 中来解决这个问题。

感谢您的帮助!

【问题讨论】:

    标签: node.js python-3.x web-crawler puppeteer


    【解决方案1】:

    您可以尝试在每个请求中使用随机用户代理来避免验证码,如下所示 (https://www.npmjs.com/package/random-useragent):

    const randomUseragent = require('random-useragent');
    await page.setUserAgent(randomUseragent.getRandom());
    

    【讨论】:

    • 如果我添加到购物车 > 查看购物车 > 继续结帐 > 输入电子邮件 > 在输入密码时它还要求输入验证码,所以我不确定用户代理是否会一直让我结帐postimg.cc/wRXbDnY0你有什么建议吗?
    猜你喜欢
    • 2019-10-01
    • 2013-09-03
    • 2017-01-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-05-03
    • 2018-03-16
    相关资源
    最近更新 更多