一张图 了解 爬虫程序反爬虫 之间的关系:
Python网络爬虫(七)了解爬取与反爬策略

我的Python学习专栏 中,了解了 爬虫基础 :

  1. chrome网页解析方法
  2. requests模拟访问网页
  3. re正则表达式筛选关键词
  4. bs4框架等

其中也了解了部分反爬基础:

  1. 模拟网页登录而不是Python访问网
    (网页访问是基于每个浏览器不同,有不同的request-header,如果是Python访问则没有)
  2. 其次,深入一点是cookie
    (这是加密网站给每次密码登录用户的一个辨别身份的代号,随登陆时网站刷新而刷新)
  3. base4加密算法(登录名+密码)
  4. 简单验证码处理
  5. more(学习中~)

相关文章:

  • 2021-12-15
  • 2021-07-25
  • 2021-11-19
  • 2021-12-05
  • 2021-11-18
猜你喜欢
  • 2021-11-18
  • 2022-01-03
  • 2022-12-23
  • 2022-01-09
相关资源
相似解决方案