python 爬虫基本库使用urllib之urlopen(一)

urllib是python内置的请求库。它主要包含四个模块：

request :是最基本的HTTP请求模块，可以用来模拟发送请求。
error:异常处理模块，如果请求出现错误，可以捕获异常，然后进行其他操作，保证程序不会意外终止。
parse:工具模块，提供了很多URL处理方法，比如拆分、解析、合并等。
robotparser:主要用来识别网站的robots.txt文件，然后判断哪些网站可以爬。

使用urllib的request模块中的方法urlopen抓取python官网，这样我们想要的东西就可以提取出来了

import urllib.request

response = urllib.request.urlopen('https://www.python.org')
print(type(response))  #类型
print(response.read().decode('utf-8'))

python 爬虫基本库使用urllib之urlopen(一)

python 爬虫基本库使用urllib之urlopen(一)

相关文章：

2021-11-10
2021-06-20
2021-10-10
2021-05-22
2022-12-23

猜你喜欢

2022-12-23
2021-10-23
2021-05-26
2021-09-19
2022-12-23
2022-12-23
2021-09-27

相关资源

下载 2022-12-29
下载 2021-06-06
下载 2021-06-06

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode