【转】Web缓存技术相关简析

简介: Web缓存最权威的资料就属RFC了,可惜它太过言简意赅,本文将对缓存做一些通俗易懂的介绍。Expires / Cache-Control:当服务器发出响应的时候,可以通过两种方式来告诉客户端缓存请求:第一种是Expires,比如:Expires: Sun, 16 Oct 2016 05:43:02 GMT在此日期之前,客户端都会认为缓存是有效的。

Web缓存最权威的资料就属RFC了,可惜它太过言简意赅,本文将对缓存做一些通俗易懂的介绍。

Expires / Cache-Control:

当服务器发出响应的时候,可以通过两种方式来告诉客户端缓存请求:

第一种是Expires,比如:

Expires: Sun, 16 Oct 2016 05:43:02 GMT

在此日期之前,客户端都会认为缓存是有效的。

不过Expires有缺点,比如说,服务端和客户端的时间设置可能不同,这就会使缓存的失效可能并不能精确的按服务器的预期进行。

第二种是Cache-Control,比如:

Cache-Control: max-age=315360000

这里声明的是一个相对的秒数,表示从现在起,315360000秒内缓存都是有效的,这样就避免了服务端和客户端时间不一致的问题。

但是Cache-Control是HTTP1.1才有的,不适用与HTTP1.0,而Expires既适用于HTTP1.0,也适用于HTTP1.1,所以说在大多数情况下同时发送这两个头会是一个更好的选择,当客户端两种头都能解析的时候,会优先使用Cache-Control。

参考Apache相关文档

条件GET:Last-Modified / If-Modified-Since和ETag / If-None-Match

Last-Modified / If-Modified-Since

Last-Modified是响应头,If-Modified-Since是请求头。Last-Modified把Web组件的最后修改时间告诉客户端,客户端在下次请求此Web组件的时候,会把上次服务端响应的最后修改时间作为If-Modified-Since的值发送给服务器,服务器可以通过这个值来判断是否需要重新发送,如果不需要,就简单的发送一个304状态码,客户端将从缓存里直接读取所需的Web组件。

ETag / If-None-Match

ETag是响应头,If-None-Match是请求头。Last-Modified / If-Modified-Since的主要缺点就是它只能精确到秒的级别,一旦在一秒的时间里出现了多次修改,那么Last-Modified / If-Modified-Since是无法体现的。相比较,ETag / If-None-Match没有使用时间作为判断标准,而是使用一个特征串。Etag把Web组件的特征串告诉客户端,客户端在下次请求此Web组件的时候,会把上次服务端响应的特征串作为If-None-Match的值发送给服务端,服务端可以通过这个值来判断是否需要从重新发送,如果不需要,就简单的发送一个304状态码,客户端将从缓存里直接读取所需的Web组件。

一些建议:

当使用Expires / Cache-Control的时候,尽量给图片,样式表,脚本等设置一个足够大的缓存时间,如果在此期间,缓存文件有过修改,最简单的更新方式是改名或者设置一个查询参数,比如开始图片名是logo.gif,如果做了一个新的图片,你想更新,可以把图片改名为logo_v2.gif,或者给图片设置一个查询参数logo.gif?foobar,这样,浏览器就会去请求新的图片了。不过,并不是所有的Web组件都适合有一个大的缓存时间,比如html,就不适合使用过大的缓存时间,否则你在缓存到期前,就没机会更新任何东西了。

使用Yslow的都知道,它不建议使用ETag,理由是Etag在分布式环境里,会给服务器造成不必要的压力,比如说在Apache里,Etag缺省是由三个因素决定的:INode Size MTime,而同一个图片,在不同服务器上的INode是不同的,所以在两个服务器上先后请求同一个图片,会得到两次200,虽然我们可以通过设置FileETag Size MTime来屏蔽INode,从而达到一次200,一次304的效果,但304也是要通过一次条件GET请求验证的,所以说,还是通过Expires / Cache-Control来设置一个足够大的缓存时间更划算一些,如此说来,对图片,样式表,脚本等静态内容而言,设置一个大的过期时间是绝对必要的,而Etag和Last-Modified则不是必要的。

如果你决定禁止ETag的话,简单的使用FileETag None就能达到目的。

如果你想把Last-Modified也禁止的话,似乎没有直接的方法,只能通过header模块的方式:

LoadModule headers_module modules/mod_headers.so

<FilesMatch "...">
Header unset Last-Modified
</FilesMatch>


不理解缓存可能会让我们作出很多错误的判断,比如说很多人在估算带宽的时候一般是按照如下的流程来计算带宽的(以每天百万访问量为例来说明):

如果100万PV的访问量在一天内平均分布的话,折合到每秒大约12次访问,如果按平均每次访问页面的大小是100K字节左右计算的话,这12次访 问总计大约就是1200K字节,字节的单位是Byte,而带宽的单位是bit,它们之间的关系是1Byte = 8bit,所以1200K Byte大致就相当于9600K bit,也就是9Mbps的样子,实际情况中,我们的网站必须能在峰值流量时保持正常访问,假设峰值流量是平均流量的5倍,于是得出真实带宽的需求应该在45Mbps 左右。

如上的计算只在一种情况下是正确的,那就是网站服务器关闭了缓存或者网站的浏览者关闭了缓存!不过现实情况我们出于性能的考虑肯定要加入缓存,用户在有缓存的情况下产生的流量要远远小于没有缓存时产生的流量。所以在估算带宽的时候,我们还得考虑携带缓存浏览的浏览者在总浏览者中所占的比例,说白了就是回头客的比例,这样才能作出准确的判断,否则会多花很多冤枉钱。

参考资料:Caching Tutorial for Web Authors and Webmasters(英文版)(中文版

相关文章
|
2月前
|
安全 Java API
Java Web 在线商城项目最新技术实操指南帮助开发者高效完成商城项目开发
本项目基于Spring Boot 3.2与Vue 3构建现代化在线商城,涵盖技术选型、核心功能实现、安全控制与容器化部署,助开发者掌握最新Java Web全栈开发实践。
316 1
|
7月前
|
机器学习/深度学习 存储 缓存
加速LLM大模型推理,KV缓存技术详解与PyTorch实现
大型语言模型(LLM)的推理效率是AI领域的重要挑战。本文聚焦KV缓存技术,通过存储复用注意力机制中的Key和Value张量,减少冗余计算,显著提升推理效率。文章从理论到实践,详细解析KV缓存原理、实现与性能优势,并提供PyTorch代码示例。实验表明,该技术在长序列生成中可将推理时间降低近60%,为大模型优化提供了有效方案。
1280 15
加速LLM大模型推理,KV缓存技术详解与PyTorch实现
|
5月前
|
缓存 负载均衡 网络协议
电商API接口性能优化技术揭秘:缓存策略与负载均衡详解
电商API接口性能优化是提升系统稳定性和用户体验的关键。本文聚焦缓存策略与负载均衡两大核心,详解其在电商业务中的实践。缓存策略涵盖本地、分布式及CDN缓存,通过全量或部分缓存设计和一致性维护,减少后端压力;负载均衡则利用反向代理、DNS轮询等技术,结合动态调整与冗余部署,提高吞吐量与可用性。文中引用大型及跨境电商平台案例,展示优化效果,强调持续监控与迭代的重要性,为电商企业提供了切实可行的性能优化路径。
|
5月前
|
缓存 前端开发 应用服务中间件
Web端实时通信技术SSE在携程机票业务中的实践应用
本文介绍了携程机票前端基于Server-Sent Events(SSE)实现服务端推送的企业级全链路通用技术解决方案。文章深入探讨了 SSE 技术在应用过程中包括方案对比、技术选型、链路层优化以及实际效果等多维度的技术细节,为类似使用场景提供普适性参考和借鉴。该方案设计目标是实现通用性,适用于各种网络架构和业务场景。
150 1
|
6月前
|
缓存 前端开发 应用服务中间件
Web端实时通信技术SSE在携程机票业务中的实践应用
本文介绍了携程机票前端基于Server-Sent Events(SSE)实现服务端推送的企业级全链路通用技术解决方案。文章深入探讨了 SSE 技术在应用过程中包括方案对比、技术选型、链路层优化以及实际效果等多维度的技术细节,为类似使用场景提供普适性参考和借鉴。
190 7
|
11月前
|
数据采集 存储 缓存
如何使用缓存技术提升Python爬虫效率
如何使用缓存技术提升Python爬虫效率
|
11月前
|
存储 缓存 负载均衡
从零到一:分布式缓存技术初探
分布式缓存通过将数据存储在多个节点上,利用负载均衡算法提高访问速度、降低数据库负载并增强系统可用性。常见产品有Redis、Memcached等。其优势包括性能扩展、高可用性、负载均衡和容错性,适用于页面缓存、应用对象缓存、状态缓存、并行处理、事件处理及极限事务处理等多种场景。
645 1
|
12月前
|
人工智能 安全 物联网
区块链技术的未来展望:去中心化金融(DeFi)与Web 3.0的融合
区块链技术的未来展望:去中心化金融(DeFi)与Web 3.0的融合
|
12月前
|
前端开发 JavaScript 搜索推荐
HTML与CSS在Web组件化中的核心作用及前端技术趋势
本文探讨了HTML与CSS在Web组件化中的核心作用及前端技术趋势。从结构定义、语义化到样式封装与布局控制,两者不仅提升了代码复用率和可维护性,还通过响应式设计、动态样式等技术增强了用户体验。面对兼容性、代码复杂度等挑战,文章提出了相应的解决策略,强调了持续创新的重要性,旨在构建高效、灵活的Web应用。
244 6
|
12月前
|
XML 前端开发 JavaScript
PHP与Ajax在Web开发中的交互技术。PHP作为服务器端脚本语言,处理数据和业务逻辑
本文深入探讨了PHP与Ajax在Web开发中的交互技术。PHP作为服务器端脚本语言,处理数据和业务逻辑;Ajax则通过异步请求实现页面无刷新更新。文中详细介绍了两者的工作原理、数据传输格式选择、具体实现方法及实际应用案例,如实时数据更新、表单验证与提交、动态加载内容等。同时,针对跨域问题、数据安全与性能优化提出了建议。总结指出,PHP与Ajax的结合能显著提升Web应用的效率和用户体验。
263 3