nginx-md-diange/nginx-md/第一章:HTTP基础.md

10 KiB
Raw Blame History

HTTP基础

作者:行癫(盗版必究)


HTTP工作原理

1.基本概念

HTTP协议工作于客户端-服务端C/SB/S架构上浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求

Web服务器有LinuxNginxApache服务器window-serverIIS服务器Internet Information Services

Web服务器根据接收到的请求后向客户端发送响应信息

HTTP使用统一资源标识符Uniform Resource Identifiers, URI来传输数据和建立连接

HTTP协议默认端口号为80

HTTPS协议默认端口号为443

2.HTTP协议特点

HTTP是无连接

无连接的含义是限制每次连接只处理一个请求;服务器处理完客户的请求,并收到客户的应答后,即断开连接;采用这种方式可以节省传输时间

HTTP是媒体独立的

这意味着只要客户端和服务器知道如何处理的数据内容任何类型的数据都可以通过HTTP发送客户端以及服务器指定使用适合的MIME-TYPE内容类型注意mime类型是描述消息内容类型的因特网标准多用途互联网邮件扩展

HTTP是无状态

HTTP协议是无状态协议无状态是指协议对于事务处理没有记忆能力缺少状态意味着如果后续处理需要前面的信息则它必须重传这样可能导致每次连接传送的数据量增大另一方面在服务器不需要先前信息时它的应答就较快

3.HTTP协议通信流程

image-20230608115432561

注意:

Common Gateway Interface通用网关接口CGI是Web服务器的接口规范用于执行在动态生成Web页面的服务器上运行的程序如控制台应用程序也称为命令行接口程序

4.HTTP交互原理

image-20221006222259783

第一步:客户端/浏览器 发送给 服务端 一条Request请求报文告诉服务器我要浏览页面"www.example.com/index.html"

第二步:服务器 返回给 客户端/浏览器 一条Response应答报文,告诉客户端,好的!接收吧,这是你要的数据

HTTP消息结构

1.客户端请求

客户端发送一个HTTP请求到服务器的请求消息包括以下格式请求行request line、请求头部header、空行和请求数据

image-20221006220623831

Headers General

image-20221006221112990

Request URL请求地址

Request Method请求方法

Status Code状态码

Remote Address远程地址

Request Headers

image-20221006221700897

authority : 认证访问信息包括主机地址host可选端口可选的用户信息userinfo(用户密码认证信息)

method请求方法

path访问资源路径以"/"开始表示绝对路径,每层目录都使用"/"分割

scheme标识协议类型例如 http/https/ftp/jdbc

accept客户可以接受的媒体格式

accept-encoding客户可以处理的编码方案

accept-language客户能够接受的语言

cache-control缓存控制

cookie会话管理把cookie回送给服务器

referer告诉服务器当前请求从哪里来作用实现防盗链

user-agent客户端程序标识

2.服务器响应

HTTP响应也由四个部分组成分别是状态行、消息报头、空行和响应正文

image-20221006224055906

Response Headers

image-20221006224234945

cache-control缓存控制

content-encoding指定编码方案

content-type指定媒体类型

date当前时间

server服务

HTTP其他特性

1.HTTP中Cache-Control

缓存控制:控制缓存的开关,用于标识请求或访问中是否开启了缓存,使用了哪种缓存方式

缓存校验:如何校验缓存,比如怎么定义缓存的有效期,怎么确保缓存是最新的

缓存控制:

在http中控制缓存开关的字段有两个Pragma 和 Cache-Control

Pragma

Pragma有两个字段Pragma和Expires

Pragma的值为no-cache时表示禁用缓存

Expires的值是一个GMT时间表示该缓存的有效时间

注意:

Pragma是旧产物已经逐步抛弃有些网站为了向下兼容还保留了这两个字段

如果一个报文中同时出现Pragma和Cache-Control时以Pragma为准

同时出现Cache-Control和Expires时以Cache-Control为准

优先级从高到低是 Pragma -> Cache-Control -> Expires

Cache-Control

符合缓存策略时,服务器不会发送新的资源,但不是说客户端和服务器就没有会话了,客户端还是会发请求到服务器的

Cache-Control除了在响应中使用在请求中也可以使用

我们用调试器来模拟下请求时带上Cache-Control勾选Disable cacheRequest Headers中有个字段Cache-Control: no-cache

image-20221007115700071

Cache-Control字段值

在请求中使用Cache-Control 时,它可选的值有

image-20221007120008648

在响应中使用Cache-Control 时,它可选的值有

image-20221007120047634

缓存校验:

在缓存中我们需要一个机制来验证缓存是否有效。比如服务器的资源更新了客户端需要及时刷新缓存又或者客户端的资源过了有效期但服务器上的资源还是旧的此时并不需要重新发送。缓存校验就是用来解决这些问题的在http 1.1 中我们主要关注下Last-Modified 和 etag 这两个字段

Last-Modified

服务端在返回资源时会将该资源的最后更改时间通过Last-Modified字段返回给客户端。客户端下次请求时通过If-Modified-Since或者If-Unmodified-Since带上Last-Modified服务端检查该时间是否与服务器的最后修改时间一致如果一致则返回304状态码不返回资源如果不一致则返回200和修改后的资源并带上新的时间

image-20221007120520149

注意:

If-Modified-Since告诉服务器如果时间一致返回状态码304

If-Unmodified-Since告诉服务器如果时间不一致返回状态码412未满足前提条件

etag

单纯的以修改时间来判断还是有缺陷比如文件的最后修改时间变了但内容没变。对于这样的情况我们可以使用etag来处理etag的方式是这样服务器通过某个算法对资源进行计算取得一串值(类似于文件的md5值)之后将该值通过etag返回给客户端客户端下次请求时通过If-None-Match或If-Match带上该值服务器对该值进行对比校验如果一致则不要返回资源

注意:

If-None-Match告诉服务器如果一致返回状态码304不一致则返回资源

If-Match告诉服务器如果不一致返回状态码412

2.HTTP请求方法

HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法

HTTP1.1新增了五种请求方法OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法

image-20230608115253911

3.HTTP状态码

当浏览者访问一个网页时浏览者的浏览器会向网页所在服务器发出请求当浏览器接收并显示网页前此网页所在的服务器会返回一个包含HTTP状态码的信息头server header用以响应浏览器的请求

常见的HTTP状态码

image-20221007121332317

200 - 请求成功

301 - 资源网页等被永久转移到其它URL(永久重定向)

302 - 临时重定向

304 - 未修改;所请求的资源未修改,服务器返回此状态码时,不会返回任何资源

404 - 请求的资源(网页等)不存在

403 - 请求被拒绝

500 - 内部服务器错误

502 - Bad gateway 服务器报错

503 - 服务器超负荷/服务器在维护

505 - 不支持http协议版本

image-20221007121822313 image-20221007121851354 image-20221007121935901 image-20221007122007966