一、Varnish 简介
Varnish是一款高性能的开源HTTP加速器,挪威最大的在线报纸 Verdens Gang 使用3台Varnish代替了原来的12台Squid,性能比以前更好。
Varnish 的作者Poul-Henning Kamp是FreeBSD的内核开发者之一,他认为现在的计算机比起1975年已经复杂许多。在1975年时,储存媒介只有两种:内存与硬盘。但现在计算 机系统的内存除了主存外,还包括了CPU内的L1、L2,甚至有L3快取。硬盘上也有自己的快取装置,因此Squid Cache自行处理物件替换的架构不可能得知这些情况而做到最佳化,但操作系统可以得知这些情况,所以这部份的工作应该交给操作系统处理,这就是 Varnish cache设计架构。
Varnish 项目是2006年发布的第一个版本0.9.距今已经八年多了,此文档之前也提过varnish还不稳定,那是2007年时候编写的,经过varnish开 发团队和网友们的辛苦耕耘,现在的varnish已经很健壮。很多门户网站已经部署了varnish,并且反应都很好,甚至反应比squid还稳定,且效 率更高,资源占用更少。相信在反向代理,web加速方面,varnish已经有足够能力代替squid。
二、Varnish状态引擎
Receive状态,也就是请求处理的入口状态,根据VCL规则判断该请求应该Pass或Pipe,还是进入Lookup(本地查询)。
Lookup状态,进入此状态后,会在hash表中查找数据,若找到,则进入Hit状态,否则进入miss状态。
Pass状态,在此状态下,会进入后端请求,即进入Fetch状态。
Fetch状态,在Fetch状态下,对请求进行后端获取,发送请求,获得数据,是否进行本地存储。
Deliver状态, 将获取到的数据发送给客户端,然后完成本次请求。
pipe状态时,请求直接传递至后端主机,在请求和返回的内容没有改变的情况下,将不变的内容返回给客户端,直到这个链接被关闭。
三、内置公用变量
VCL内置的公用变量可以用在不同的VCL函数中。下面根据这些公用变量使用的不同阶段依次进行介绍。
(1).当请求到达后,可以使用的公用变量
req.backend 指定对应的后端主机
server.ip 表示服务器端IP
client.ip 表示客户端IP
req.request 指定请求的类型,例如GET、HEAD和POST等
req.url 指定请求的地址
req.proto 表示客户端发起请求的HTTP协议版本
req.http.header 表示对应请求中的HTTP头部信息
req. restarts ;/.l表示请求重启的次数,默认最大值为4
(2).Varnish在向后端主机请求时,可以使用的公用变量
beresp.request 指定请求的类型,例如GET合HEAD等
beresp.url 指定请求的地址
beresp .proto 表示客户端发起请求的HTTP协议版本
beresp .http.header 表示对应请求中的HTTP头部信息
beresp .ttl 表示缓存的生存周期,也就是cache保留多长时间,单位是秒
(3).从cache或后端主机获取内容后,可以使用的公用变量
obj.status 表示返回内容的请求状态代码,例如200、302和504等
obj.cacheable 表示返回的内容是否可以缓存,也就是说,如果HTTP返回的是200、203、300、301、302、404或410等,并且有非0的生存期,则可以缓存
obj.valid 表示是否是有效的HTTP应答
obj.response 表示返回内容的请求状态信息
obj.proto 表示返回内容的HTTP协议版本
obj.ttl 表示返回内容的生存周期,也就是缓存时间,单位是秒
obj.lastuse 表示返回上一次请求到现在的间隔时间,单位是秒
(4).对客户端应答时,可以使用的公用变量
resp.status 表示返回给客户端的HTTP状态代码
resp.proto 表示返回给客户端的HTTP协议版本
resp.http.header 表示返回给客户端的HTTP头部信息
resp.response 表示返回给客户端的HTTP状态信息
在上面的讲述中,只介绍了常用的VCL内置公用变量,如果需要了解和使用更多的公用变量信息,请登录varnish官方网站查阅。https://www.varnish-cache.org/docs/3.0/
四、安装与基本配置
直接去官网下载rpm包安装即可。
编辑启动脚本配置文件 /etc/sysconfig/varnish
NFILES=131072 //定义最大打开文件的数量
MEMLOCK=82000 //定义用于缓存日志的空间 (KB)
NPROCS="unlimited" //最大打开的线程数量unlimited(无上限)
RELOAD_VCL=1 //无需重启服务,可以重新编译载入VCL
VARNISH_VCL_CONF=/etc/varnish/default.vcl //规则文件
VARNISH_LISTEN_PORT=80 //服务侦听端口
VARNISH_ADMIN_LISTEN_ADDRESS=127.0.0.1 //管理接口侦听的地址
VARNISH_ADMIN_LISTEN_PORT=6082 //管理端口
VARNISH_SECRET_FILE=/etc/varnish/secret //密钥文件
VARNISH_MIN_THREADS=50 //最小线程数
VARNISH_MAX_THREADS=1000 //最大线程数
VARNISH_THREAD_TIMEOUT=120 //线程超时时间
#VARNISH_STORAGE_FILE=/var/lib/varnish/varnish_storage.bin
#VARNISH_STORAGE_SIZE=1G
VARNISH_MEMORY_SIZE=64M //使用缓存的内存大小
VARNISH_STORAGE="malloc,${VARNISH_MEMORY_SIZE}" //指定缓存类型,这是是指使用内存缓存。也可以用file指定缓存至磁盘文件上。
VARNISH_TTL=120
DAEMON_OPTS="-a ${VARNISH_LISTEN_ADDRESS}:${VARNISH_LISTEN_PORT} \
-f ${VARNISH_VCL_CONF} \
-T ${VARNISH_ADMIN_LISTEN_ADDRESS}:${VARNISH_ADMIN_LISTEN_PORT} \
-t ${VARNISH_TTL} \
-w ${VARNISH_MIN_THREADS},${VARNISH_MAX_THREADS},${VARNISH_THREAD_TIMEOUT} \
-u varnish -g varnish \
-S ${VARNISH_SECRET_FILE} \
-s ${VARNISH_STORAGE}"
启动varnish
/etc/init.d/varnish start
连接管理端口,查看管理命令。
varnishadm -S /etc/varnish/secret -T 127.0.0.1:6082
五、配置一个简单的后端
vim /etc/varnish/default.vcl
backend default { //定义后端主机。
.host = "192.168.18.201";
.port = "80";
}
sub vcl_recv { //在recv调用。
set req.backend = default;
}
加载配置文件,使用配置。
varnishadm
vcl.load d2 /etc/varnish/default.vcl
vcl.use d2
测试一下
已成功代理至后端服务器,但是我们无法查看是否命中,接下来添加配置。
sub vcl_deliver {
if (obj.hits > 0) {
set resp.http.X-cache = "Hit from" +" "+server.ip;
} else {
set resp.http.X-cache = "Miss var"+" "+server.ip;
}
}
重新载入文件和上述方法相同(略)
测试效果
现在配置不让它缓存
backend default {
.host = "192.168.18.201";
.port = "80";
}
sub vcl_recv {
if (req.url ~ "\.jsp$") {
return(pass);
}
set req.backend = default;
}
sub vcl_deliver {
if (obj.hits > 0) {
set resp.http.X-cache = "Hit from" +" "+server.ip;
} else {
set resp.http.X-cache = "Miss var"+" "+server.ip;
}
}
控制某个目录下的文件不让缓存
backend default {
.host = "192.168.18.201";
.port = "80";
}
sub vcl_recv {
if (req.url ~ "^/bbs/"
) {
return(pass);
}
set req.backend = default;
}
sub vcl_deliver {
if (obj.hits > 0) {
set resp.http.X-cache = "Hit from" +" "+server.ip;
} else {
set resp.http.X-cache = "Miss var"+" "+server.ip;
}
}
上面的所有配置都是根据用户请求的内容做出决策的,下面我们来配置根据响应的内容做出决策。
定义缓存TTL时间
sub vcl_fetch {
if
(req.request ==
"GET"
&& req.url ~
"\.(html|css|js|jpg|jpeg|png|gif)$"
) {
set
beresp.ttl = 3600s;
}
}
六、两台WEB服务器动静分离实例
backend web1 {
.host = "192.168.18.201";
.port = "80";
}
backend web2 {
.host = "192.168.18.202";
.port = "80";
}
sub vcl_recv {
if (req.url ~ "\.jsp$") {
set req.backend = web2;
} else {
set req.backend = web1;
}
}
sub vcl_fetch {
if (req.request == "GET" && req.url ~ "\.(html|jpg|jpeg|css|js|bmp|ico|txt)$") {
set beresp.ttl = 3600s;
}
}
sub vcl_deliver {
if (obj.hits > 0) {
set resp.http.X-cache = "Hit from" +" "+server.ip;
} else {
set resp.http.X-cache = "Miss var"+" "+server.ip;
}
}
七、配置健康状态检测
.url //指定检测的URL
.request 探测后端主机健康状态时所请求内容的详细格式,定义后,它会替换.url指定的探测方式;比如:
.request =
"GET /.healthtest.html HTTP/1.1"
"Host: www.test.com"
"Connection: close"
;
.window //做健康状况检测时,至少要采样多少次;
.threshold //在.window中指定的次数中,至少有多少次是成功的才判定后端主机正健康运行;默认是3;
.initial //Varnish启动时对后端主机至少需要多少次的成功探测,默认同.threshold;
.expected_response //期望后端主机响应的状态码,默认为200;
.interval //探测请求的发送频率,默认为5秒;
.timeout //每次探测请求的过期时长,默认为2秒;
有两种定义方式:
1、在backend中使用.probe 定义,例:
backend www {
.host = "www.tuchao.com";
.port = "http";
.probe = {
.url = "/test.jpg";
.timeout = 1s;
.window = 8;
.threshold = 3;
.initial = 3;
}
}
2、可以明确的定义一个公共的probe,在backend中用.probe调用。例:
probe healthchk {
.url = "/health.html";
.interval = 2s;
.timeout = 2s;
.expected_response = 200;
.window = 3;
.threshold = 1;
}
backend web1 {
.host = "192.168.18.201";
.port = "80";
.probe = healthchk;
}
backend web2 {
.host = "192.168.18.202";
.port = "80";
.probe = healthchk;
}
sub vcl_recv {
if (req.url ~ "\.jsp$") {
set req.backend = web2;
} else {
set req.backend = web1;
}
}
sub vcl_fetch {
if (req.request == "GET" && req.url ~ "\.(html|jpg|jpeg|css|js|bmp|ico|txt)$") {
set beresp.ttl = 3600s;
}
}
sub vcl_deliver {
if (obj.hits > 0) {
set resp.http.X-cache = "Hit from" +" "+server.ip;
} else {
set resp.http.X-cache = "Miss var"+" "+server.ip;
}
}
八、负载均衡的实现
调度算法:
random //根据权重随机调度
hash //将同一个请求发往同一个主机
配置实例:
probe healthchk {
.url = "/health.html";
.interval = 2s;
.timeout = 2s;
.expected_response = 200;
.window = 3;
.threshold = 1;
}
backend web1 {
.host = "192.168.18.201";
.port = "80";
.probe = healthchk;
}
backend web2 {
.host = "192.168.18.202";
.port = "80";
.probe = healthchk;
}
director webs random { //定义集群,定义调度算法。
.retries = 2;
{
.backend = web1;
.weight = 1;
}
{
.backend = web2;
.weight = 1;
}
}
sub vcl_recv {
set req.backend = webs;
}
sub vcl_fetch {
if (req.request == "GET" && req.url ~ "\.(html|jpg|jpeg|css|js|bmp|ico|txt)$") {
set beresp.ttl = 3600s;
}
}
九、移除单个缓存对象配置实例
probe healthchk {
.url = "/health.html";
.interval = 2s;
.timeout = 2s;
.expected_response = 200;
.window = 3;
.threshold = 1;
}
acl purgers {
"127.0.0.1";
"192.168.18.0"/24;
}
backend web1 {
.host = "192.168.18.201";
.port = "80";
.probe = healthchk;
}
backend web2 {
.host = "192.168.18.202";
.port = "80";
.probe = healthchk;
}
director webs hash {
.retries = 2;
{
.backend = web1;
.weight = 1;
}
{
.backend = web2;
.weight = 1;
}
}
sub vcl_recv {
if (req.request == "PURGE") {
if (!client.ip ~ purgers) {
error 405 "Method not allow";
}
return (lookup);
}
set req.backend = webs;
}
sub vcl_hit {
if (req.request == "PURGE") {
purge;
error 200 "Purged";
}
}
sub vcl_miss {
if (req.request == "PURGE") {
purge;
error 404 "Not in cache.";
}
}
sub vcl_pass {
if (req.request == "PURGE") {
error 502 "Purged on a passed object.";
}
}
测试效果
先访问一下
这时执行PURGE清除
再访问一下
看,Miss,缓存被成功清除。
十、防盗链配置实例
sub vcl_recv {
if (req.http.referer ~ "http://.*" ) {
if (!(req.http.referer ~ "http://.*\.tuchao\.com" || req.http.referer ~ "http://.*\.google\.com.*" || req.http.referer ~ "http://.*\.baidu\.com.*" )) {
set req.http.host = "www.tuchao.com";
set req.url = "/referer/tuchao.html";
}
}
if (req.request == "PURGE") {
if (!client.ip ~ purgers) {
error 405 "Method not allow";
}
return (lookup);
}
set req.backend = webs;
}
测试结果
这篇就写到这里了,总共分了十个章节,希望大家能从中学习到知识。
我掌握的也不牢靠,欢迎大家与我交流QQ1183710107.