http缓存机制和原理详解

简介:

【背景】

http1.1


wKiom1gUpleCwoS3AABEfy6yhXE725.png



http1.1 是1997年开始使用的。


http是一种协议,用于传输浏览器发送的数据并接收由http server响应的数据。 浏览器就是解释html语言等内容的。



http协议构成:

request 有client(浏览器)发送

起始行 first line:

    <method> <url> <version>

1
2
     as: 
     GET /ex?i=mm_28347190_2425761_9313994 HTTP/1.1

首部 Header:

    filed:value

     as: 

1
2
3
4
5
6
     Host:www.baidu.com
     Accept-Encoding:gzip, defalt
     Referer: www.taobao.com/xxx 
     User-Aagent: IE8...
     Cookie:xxxx
     .......

主体 Body:

   数据向POST方法的json数据等



responsed(由http server发送):


起始行 first line:

    <version> <code> <reason phrase>

1
2
     as: 
     HTTP/1.1 200 OK

首部 Header:

    filed:value

     as: 

1
2
3
4
5
6
7
8
9
     Expires: Sat, 29 Oct 2016 13:59:01 GMT
     Data:  Sat, 29 Oct 2016 13:44:01 GMT
     Server: nginx
     Content-Type: text/html; charset=utf-8 
     Cache-Control:  max-age=900
     Content-Encoding: gzip
     Age: 541
     X-Via: 1.1 xzai69:8 (Cdn Cache Server V2.0), 1.1 sdta234:0 (Cdn Cache Server V2
     Connection: keep-alive

主体 Body:

   响应的数据内容html文本或者图片或者css js




注意:

1 client和server端是相对的概念的。不是说client一定是浏览器 如elinks curl splider ...程序

2 C/S 和 B/S架构的区别。主要是理解B/S架构B是指Broswer浏览器,是指将独立应用程序的实现放在浏览器中。比如浏览器中的office不用独立的office软件就可以打开word excel文档。

3 其中一个提高网页浏览速度的技术是缓存技术。比如一些网页游戏,在开始前都会加载一会就是将一些元素载入到浏览器中缓存起来。加快速度。



【缓存技术】

wKiom1gUrAThtY4pAACjLzHcs_g617.png



注意:

1 cache 中的private cache和public cache是相对的。对应存入自己电脑中的cache是只对user1可以使用的,user2 是不能使用的。所以这个缓存就是private私有缓存。  正向代理的缓存对于user1 和user2 都是可以使用的,就能同时加快user1 和user2 的速度,这个就是public cache。

2 缓存最终不是最权威的资源,会所有失效的必要性。所有要重点探索和设定的缓存时间。




【http 1.0缓存机制】

C ---> S


第一次  client向serve发起一个request,server 向client respond回应内容的头部中加入一个Expire(1.0版本中唯一一个控制缓存的头部和策略)过期时间。 


第二次 client想server发起请求的时候,第一种情况:如果内容在过期时间之内,就会使用本地的缓存。第二种情况:如果超过了过期时间,重新发起请求,并从Server端获取数据(不管数据是否有更新)



缺点: 在第二的第二种情况在,client想server端发起的请求时,如果server中的数据没有更新也被完整的响应一份数据到client端。这样就浪费了带宽资源。和服务器的响应资源。


所以引入了http1.1 版本,有一个询问的机制条件式判断,请求的时候可以发送一个头部为If-Modify-Since到Server端。自动那个时候,内容是否有更新呢? 如果没更新就返回304的响应码,Not-Modify。



【http 1.1缓存机制】

丰富的头部信息控制缓存策略


1、缓存相关的HTTP首部


HTTP协议提供了多个首部用以实现页面缓存及缓存失效的相关功能,这其中最常用的有:

(1)Expires:用于指定某web对象的过期日期/时间,通常为GMT格式;一般不应该将此设定的未来过长的时间,一年的长度对大多场景来说足矣;其常用于为纯静态内容如JavaScripts样式表或图片指定缓存周期;

(2)Cache-Control:用于定义所有的缓存机制都必须遵循的缓存指示,这些指示是一些特定的指令,包括public、private、no-cache(表示可以存储,但在重新验正其有效性之前不能用于响应客户端请求)、no-store、max-age、s-maxage以及must-revalidate等;Cache-Control中设定的时间会覆盖Expires中指定的时间;

    public: 定义为共有的缓存

    private: 私有的缓存

    no-cache: 存储但必须校验

    no-store:不存储

    max-age:缓存最大时长

    s-maxage:只能用于公共缓存或者共享式缓存 中指定最大缓存时长

    must-revalidate:必须重新校验

    

    

(3)Etag:响应首部,用于在响应报文中为某web资源定义版本标识符;(解决 时间戳对比 秒级别的粗糙,无法判断文件是否更新,用于验证秒一下级别的更新)


条件时请求判断机制:

(4)Last-Mofified:响应首部,用于回应客户端关于Last-Modified-Since或If-None-Match首部的请求,以通知客户端其请求的web对象最近的修改时间;


(5)If-Modified-Since:条件式请求首部,如果在此首部指定的时间后其请求的web内容发生了更改,则服务器响应更改后的内容,否则,则响应304(not modified);

(6)If-None-Match:条件式请求首部;web服务器为某web内容定义了Etag首部,客户端请求时能获取并保存这个首部的值(即标签);而后在后续的请求中会通过If-None-Match首部附加其认可的标签列表并让服务器端检验其原始内容是否有可以与此列表中的某标签匹配的标签;如果有,则响应304,否则,则返回原始内容;

(7)Vary:响应首部,原始服务器根据请求来源的不同响应的可能会有所不同的首部,最常用的是Vary: Accept-Encoding,用于通知缓存机制其内容看起来可能不同于用户请求时Accept-Encoding-header首部标识的编码格式;

(8)Age:缓存服务器可以发送的一个额外的响应首部,用于指定响应的有效期限;浏览器通常根据此首部决定内容的缓存时长;如果响应报文首部还使用了max-age指令,那么缓存的有效时长为“max-age减去Age”的结果;



 Age(响应标头,HTTP1.1)

                                        

Age标头,对于原始服务器来说,用于指明,当前资源被生成了多久,即存活期.而对于一个缓存代理服务器来说,它表示缓存副本,被缓存了多久.缓存代理服务器,必须生成Age头.其值以秒为单位.且可能为负值.

寿命:即响应的寿命,指从原始服务器发出实体后所经历的时间,或者是重新验证,证明某缓存仍处于最新状态(可信赖)之后,所经历的时间. 参考响应头中的 Age,其单位是秒.






【实践-分析-理解】


谷歌浏览器 f5(ctrl +r) 和 ctrl+f5的区别



f5是刷新,但是不彻底: 会在请求的是后加上 

  1. If-Modified-Since:  和 max-age:0  


请求的时候问 server你是否有更新,有如server 查看更新时间一样,就返回304 表示没有更新。



ctrl+f5是强制更新,刷新页面,server返回的一定是200(资源存在的前提)。 会在http的请求头加上

Cache-Control: no-cache




概念解释如下:

Cache-Control  no-cache — 强制每次请求直接发送给源服务器,而不经过本地缓存版本的校验。这对于需要确认认证应用很有用(可以和public结合使用),或者严格要求使用最新数据 的应用(不惜牺牲使用缓存的所有好处) 

Pragma 当"no-cache"出现在请求消息中时,应用程序应当向原始服务器推送此请求,即使它已 

经在上次请求时已经缓存了一份拷贝。这样将保证客户端能接收到最权威的回应。它也用来 

在客户端发现其缓存中拷贝不可用或过期时,对拷贝进行强制刷新。 

cache-control 

max-age>0 时 直接从游览器缓存中 提取 

max-age<=0 时 向server 发送http 请求确认 ,该资源是否有修改 

有的话 返回200 ,无的话 返回304. 

本文转自残剑博客51CTO博客,原文链接http://blog.51cto.com/cuidehua/1867220如需转载请自行联系原作者


cuizhiliang

相关文章
|
14天前
|
算法 网络协议 安全
HTTP 原理和面试题
HTTP 原理和面试题
|
2天前
|
网络协议 网络安全 程序员
socket,tcp,http三者之间的原理和区别
socket,tcp,http三者之间的原理和区别
socket,tcp,http三者之间的原理和区别
|
4天前
|
安全 网络协议 应用服务中间件
一文读懂HTTPS⭐揭秘加密传输背后的原理与Nginx配置攻略
一文读懂HTTPS⭐揭秘加密传输背后的原理与Nginx配置攻略
|
5天前
|
缓存 安全 算法
网络原理 HTTP _ HTTPS
网络原理 HTTP _ HTTPS
10 0
|
6天前
|
存储 缓存 运维
【Docker 专栏】Docker 镜像的分层存储与缓存机制
【5月更文挑战第8天】Docker 镜像采用分层存储,减少空间占用并提升构建效率。每个镜像由多个层组成,共享基础层(如 Ubuntu)和应用层。缓存机制加速构建和运行,通过检查已有层来避免重复操作。有效管理缓存,如清理无用缓存和控制大小,可优化性能。分层和缓存带来资源高效利用、快速构建和灵活管理,但也面临缓存失效和层管理挑战。理解这一机制对开发者和运维至关重要。
【Docker 专栏】Docker 镜像的分层存储与缓存机制
|
7天前
|
存储 缓存 移动开发
html实现离线缓存(工作原理+怎么使用+应用场景)
html实现离线缓存(工作原理+怎么使用+应用场景)
15 0
|
12天前
|
缓存 NoSQL Java
17:缓存机制-Java Spring
17:缓存机制-Java Spring
34 5
|
13天前
|
存储 缓存 自然语言处理
深入PHP内核:探索Opcode缓存机制
【5月更文挑战第1天】 在动态语言如PHP的执行过程中,每次脚本被请求时都需要经过一系列复杂的解析和编译步骤。为了优化这一过程并提高性能,PHP引入了Opcode缓存机制。本文将详细探讨Opcode的概念、作用以及它如何显著提升PHP应用的执行效率。我们将从缓存原理出发,分析几种常见的Opcode缓存工具,并通过实例说明如何在实际项目中实现和优化缓存策略。
|
14天前
|
安全 网络协议 算法
【计算机网络】http协议的原理与应用,https是如何保证安全传输的
【计算机网络】http协议的原理与应用,https是如何保证安全传输的
|
15天前
|
缓存 NoSQL PHP
【PHP开发专栏】PHP缓存机制与实现
【4月更文挑战第29天】本文介绍了PHP缓存的基本概念、策略及实现方式。PHP缓存包括应用缓存、Web服务器缓存、数据库缓存和分布式缓存,常见策略有缓存预热、更新和懒加载。PHP的缓存实现包括文件缓存、APC、OPcache、Memcached和Redis。最佳实践包括缓存热点数据、控制粒度、设置失效策略、保证一致性和确保安全性。文中还提供了一个新闻列表和详情页的缓存实战示例,帮助开发者理解如何在实际项目中应用缓存。