前言
随着互联网的迅猛发展和网络的普及,各类网站层出不穷,网站也成为企业宣传和实力展现的主要途径之一,说到网站就不得不说一下web服务了,现在比较流行的web服务还是当属Apache即httpd。本文将详解http协议及httpd的特性。
http协议详解
http协议
http: Hyper Text Transfer Protocol 超文本传输协议
传输文本:HTML
html: Hyper Text Mark Language 超文本标记语言
html文档的生成方式
静态:纯html格式文档
动态:编程语言编写的程序可输出html格式的结果
http协议版本
http 0.9: 仅用于传输html文档
http 1.0:引入MIME机制,从而支持多媒体数据;引入keep-alive(持久连接);缓存
http 1.1:更多请求方法,更精细缓存控制;持久连接(persistent)
注意:http协议是无状态的
http事务:一次请求及对应的响应
CGI:Common Gateway Interface 通用网关接口
http协议报文
请求报文
报文详解
请求报文主要由请求行、请求头部和请求数据(实体)组成
①请求行
请求行由请求方法字段、请求资源字段(URL)和协议版本字段组成
http方法:
|
1
2
3
4
5
6
7
8
|
GET:请求获取一个资源,需要服务器发送HEAD:跟GET近似,但其不需要服务响应请求的资源,而返回响应首部POST:基于HTML表单向服务器提交数据,服务器通常需要存储此数据(位置:通常为关系型数据库)PUT:与GET相反,向服务器发送资源;服务器通常需要存储此资源(位置:通常为文件系统)DELETE:删除URL指向的资源OPTIONS:探测服务器端对请求的URL所支持使用的请求方法TRACE:跟一次请求中间所经过的代理服务器、防火墙或网关等#注意:方法严格区分大小写 |
资源名称:URI (Uniform Resource Idnentifier)
URL :描述一个特定服务器上某资源的特定位置
|
1
2
3
4
5
|
可以是相对路径,也可以绝对路径例如:http://www.scholar.com/download/index.html
分为三部分:
scheme(方案):http://
服务器:www.scholar.com 特定服务器上的资源:/download/index.html
|
协议版本:例如HTTP/1.0, HTTP/1.1
②请求头部
http协议首部:
通用首部
|
1
2
3
4
|
Connection: 定义C/S之间关于请求、响应的有关选项
Connection: keep-aliveCache-Control: 缓存控制Via: 显示了报文经过的中间节点 |
请求首部
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
Client-IP:客户端IPHost: 请求的主机Referer: 指明了请求当前资源原始资源的URLUser-Agent: 用户代理Accept首部:Accept: 指明服务器能发送的媒体类型Accept-Charset: 支持使用的字符集Accept-Encoding: 支持使用的编码方式Accept-Language: 支持使用语言条件式请求:Expect: 告诉服务器能够发送哪些媒体类型If-Modified-Since: 是否在指定时间内修改过此资源If-None-Match:如果提供的实体标记与当前文档的实体标记不符,就获取此文档跟安全相关请求:Authorization: 客户端提交给服务器的认证数据,如帐号和密码Cookie: 客户端发送给服务器身份标识 |
实体首部
|
1
2
3
4
5
6
7
8
9
10
11
12
13
|
Location: 资源的新位置Allow: 允许对此资源使用的请求方法内容相关的首部:Content-Encoding: 支持编码Content-Language:支持语言Content-Length:文本长度Content-Location:资源所在位置Content-Type:主体对象类型Content-Range:在整个资源中此实体表示的字节范围缓存相关:ETag: 实体标签Expires: 过期期限Last-Modified: 上次修改时间 |
③实体
实体内包含客户端请求服务器的数据
响应报文
报文详解
响应报文主要由状态行、响应头部和响应数据(实体)组成
①状态行
状态行由协议版本字段、状态码字段和原因短语字段组成
状态码:
|
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
|
1XX:信息性状态码2XX:成功状态码 200:OK,客户端请求成功
201:CREATED,请求已被实现
3XX: 重定向类的状态码 301: Moved Permanently, 永久重定向
302: Found, 临时重定向,会在响应报文中使用“Location: 新位置”
304: Not Modified,条件式请求中使用
4XX:客户端类错误 403:Forbidden,请求被服务器拒绝
404: Not Found,服务器无法找到请求的URL
405: Method Not Allowed,不允许使用此方法请求相应的URL
5XX:服务器类的错误 500:Internal Server Error, 服务器内部错误
502:Bad Gateway, 代理服务器从上游服务器收到一条伪响应
503:Service Unavailable, 服务暂时不可用
504:Gateway Timeout,网关超时
505:HTTP Version Not Supported,服务器不支持
|
②响应头部
响应首部
|
1
2
3
4
5
6
7
8
9
10
11
12
13
|
Date:消息产生的时间Age: 响应持续时间Server: 向客户端说明自己的程序名称和版本ETage:不透明验证者Location:URL备用的位置Content-Length:实体的长度Content-Tyep:实体的媒体类型协商首部:ary: 首部列表,服务器会根据列表中的内容挑一个最适用的版本发送给客户端Accept-Ranges: 对当前资源来讲,服务器所能够接受的范围类型跟安全相关:WWW-Authentication:质询,即要求客户提供帐号和密码Set-Cookie:服务器端在某客户端第一次请求时发送令牌 |
③实体
实体内包含客户端请求的数据,根据解析请求报文内的请求数据,将客户端请求的数据打包,通过响应报文发送给客户端,如果请求出现错误,则显示报文内的错误代码及原因。
资源请求过程及服务器结构
一次Web资源请求的具体过程(服务器的角度):
|
1
2
3
4
5
6
7
|
建立连接接收请求处理请求访问资源构建响应发送响应记录日志 |
web服务器的I/O结构:
单进程模型:串行
多进程模型:每个进程响应一个用户请求实现并发的效果
复用的I/O机制:一个进程生成多个线程,每个线程响应一个用户请求
复用的I/O机制:多个线程,每个线程响应多个用户请求;
httpd特性详解
httpd特性
高度模块化:core + modules
DSO: Dynamic Shared Object
MPM:Multipath Processing Module
|
1
2
3
4
|
MPM包含:prefork: 每个进程响应一个用户请求,预先生成多个空闲进程;worker: 启动多个进程,每个进程生成多个线程,每个线程响应一个用户请求;event: 启动多个线程,每个线程响应N个请求; |
httpd功能特性
丰富用户认证:基本认证和摘要认证
CGI:原生支持perl CGI
虚拟主机:基于端口、IP、主机名
反向代理:负载均衡
用户站点:用户可在家目录创建站点
路径别名:alias
支持第三方模块
The end
好了,http协议及httpd特性就说到这里了。下文将讲解虚拟主机和基于用户访问控制及SSL实现https等配置,有兴趣可以继续关注呦。以上仅为个人学习整理,如有错漏,大神勿喷~~~
本文转自 北城书生 51CTO博客,原文链接:http://blog.51cto.com/scholar/1631602