爬虫-正则表达式

import requests
import re

content =  requests.get(\'https://book.douban.com\').text
#partten = re.compile(\'<li.*?cover.*?href="(.*?)".*?title="(.*?)".*?</li>\',re.S)
partten = re.compile(\'<li.*?cover.*?title="(.*?)".*?more-meta.*?author">(.*?)</span>.*?year">(.*?)</span>.*?</li>\',re.S)
results = re.findall(partten,content)
for result in results:
    name,author,date = result
    #author = re.sub(\'\s\',\'\',author)
    #date = re.sub(\'\s\',\'\',date)
    print(name,author.strip(),date.strip())

相关资源

织梦正则表达式 chm版下载 2023-03-28
XRegExp V2.0 JavaScript正则表达式库下载 2021-07-04
正则表达式系统教程 CHM 正则参考下载 2023-01-20
PHP 正则表达式介绍 pdf版下载 2023-02-02
php 正则表达式视频教程下载 2022-12-15

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode