第一步

#src链接要符合下面要求,这里返回是 false or true

valid_img(src):
  return src.endswith('jpg') and 'img.jandan.net' in src

第二步

然后可以把上面的方法,套到find_all 里面用

#获取属性src符合上面规则的 img标签

for img in soup.find_all('img', src=valid_img):
  src = img['src']

 

来源 http://www.testclass.net/crawler/get_images/

相关文章:

  • 2021-05-27
  • 2022-12-23
  • 2021-05-26
  • 2022-12-23
  • 2021-10-25
  • 2021-11-19
  • 2022-01-29
猜你喜欢
  • 2021-09-27
  • 2022-12-23
  • 2021-07-22
  • 2021-08-10
  • 2022-12-23
  • 2021-11-01
  • 2021-11-10
相关资源
相似解决方案