一 重写功能 rewrite
(一)rewrite 介绍
Nginx服务器利用 ngx_http_rewrite_module 模块解析和处理rewrite请求,此功能依靠 PCRE(perl compatible regular expression),因此编译之前要安装PCRE库,rewrite是nginx服务器的重要功能之一,用于实现URL的重写,URL的重写是非常有用的功能,比如它可以在我们改变网站结构之后,不需要客户端修改原来的书签,也无需其他网站修改我们的链接,就可以设置为自动访问,另外还可以在一定程度上提高网站的安全性。
(二)ngx_http_rewrite_module模块指令
官方文档: Module ngx_http_rewrite_module
1, if 指令
1.1 语法
用于条件匹配判断,并根据条件判断结果选择不同的Nginx配置,可以配置在serve或location块中进行配置,Nginx的if语法仅能使用if做单次判断,不支持使用if else或者if elif这样的多重判断,用法如下:
if (条件匹配) { action }
1.2 使用正则
使用正则表达式对变量进行匹配,匹配成功时if指令认为条件为true,否则认为false,变量与表达式之间使用以下符号链接:
= | #比较变量和字符串是否相等,相等时if指令认为该条件为true,反之为false |
!= | #比较变量和字符串是否不相等,不相等时if指令认为条件为true,反之为false |
~ | #区分大小写字符,可以通过正则表达式匹配,满足匹配条件为真,不满足匹配条件为假 |
!~ | #区分大小写字符,判断是否匹配,不满足匹配条件为真,满足匹配条件为假 |
~* | #不区分大小写字符,可以通过正则表达式匹配,满足匹配条件为真,不满足匹配条件为假 |
!~* | #不区分大小字符,判断是否匹配,满足匹配条件为假,不满足匹配条件为真 |
-f 和 !-f | #判断请求的文件是否存在和是否不存在 |
-d 和 !-d | #判断请求的目录是否存在和是否不存在 |
-x 和 !-x | #判断文件是否可执行和是否不可执行 |
-e 和 !-e | #判断请求的文件或目录是否存在和是否不存在(包括文件,目录,软链接) |
#注意:
#如果$变量的值为空字符串或0,则if指令认为该条件为false,其他条件为true。
1.3 示例
显示协议
2,return
return用于完成对请求的处理,并直接向客户端返回响应状态码,比如:可以指定重定向URL(对于特殊重定向状态码,301/302等) 或者是指定提示文本内容(对于特殊状态码403/500等),处于此指令后的所有配置都将不被执行,return可以在server、if 和 location块进行配置
2.1 语法格式
return code; #返回给客户端指定的HTTP状态码 return code [text]; #返回给客户端的状态码及响应报文的实体内容,可以调用变量,其中text如果有空格,需要用单或双引号 return code url; #返回给客户端的URL地址
2.2 示例
服务机配置文件:
客户机访问192.168.217.66/瞎写的内容 可以看到状态码是302并 返回主页面
2.3 状态码302 和301 区别
301 永久重定向 读取过一次就会将此条配置缓存在我们的客户端,即使 nginx 服务器宕机,在缓存时间内还是可以 跳转
302 临时重定向不会有存在客户, 每次跳转需要ginx服务解析,一旦服务器宕机就无法跳转
实验:
将302 改为301
并关闭nginx
客户机访问:
2.4 return 自定义状态码和内容
服务机配置文件:
客户机:
3, set 指令
指定key并给其定义一个变量,变量可以调用Nginx内置变量赋值给key,另外set定义格式为set $key value,value可以是text, variables和两者的组合。(详细见 nginx变量 这一章)
4, break 指令
用于中断当前相同作用域(location)中的其他Nginx配置,与该指令处于同一作用域的Nginx配置中,位于它前面的配置生效,位于后面的 ngx_http_rewrite_module 模块中指令就不再执行,Nginx服务器在根据配置处理请求的过程中遇到该指令的时候,回到上一层作用域继续向下读取配置,该指令可以在server块和locationif块中使用
注意:如果break指令在location块中后续指令还会继续执行,只是不执行 ngx_http_rewrite_module 模块的指令,其它指令还会执行
语法如下:
if ($slow) { limit_rate 10k; break; } location /main { root /data/nginx/html/pc; index index.html; default_type text/html; set $name kgc; echo $name; break; #location块中break后面指令还会执行 set $my_port $server_port; echo $my_port; }
(三) rewrite 指令
通过正则表达式的匹配来改变URI,可以同时存在一个或多个指令,按照顺序依次对URI进行匹配,rewrite主要是针对用户请求的URL或者是URI做具体处理
可以理解为 % s/旧的/新的/
1,官方文档
https://nginx.org/en/docs/http/ngx_http_rewrite_module.html#rewrite
2,语法格式
rewrite可以配置在 server、location、if 语法格式 : rewrite regex replacement(www.baidu.com) [flag]; 正则匹配原始访问url 替代你想让客户访问的 标志 标志分为:()premanent301 redirect302 break last
3, rewrite 规则
3.1 rewrite可以配置在 server、location、if
3.2 如果在同一级配置块中存在多个rewrite规则,那么会自下而下逐个检查;被某条件规则替换完成后,会重新一轮的替换检查,隐含有循环机制,但不超过10次;如果超过,提示500响应码,[flag]所表示的标志位用于控制此循环机制如果替换后的URL是以http://或https://开头,则替换结果会直接以重定向返回给客户端, 即永久重定向 301
4, rewrite 相关正则表达式
. #匹配除换行符以外的任意字符 \w #匹配字母或数字或下划线或汉字 \s #匹配任意的空白符 \d #匹配数字 [0-9] \b #匹配单词的开始或结束 ^ #匹配字付串的开始 $ #匹配字符串的结束 * #匹配重复零次或更多次 + #匹配重复一次或更多次 ? #匹配重复零次或一次 {n} #匹配重复n次 {n,} #匹配重复n次或更多次 {n,m} #匹配重复n到m次 *? #匹配重复任意次,但尽可能少重复 +? #匹配重复1次或更多次,但尽可能少重复 ?? #匹配重复0次或1次,但尽可能少重复 {n,m}? #匹配重复n到m次,但尽可能少重复 {n,}? #匹配重复n次以上,但尽可能少重复 \W #匹配任意不是字母,数字,下划线,汉字的字符 \S #匹配任意不是空白符的字符 \D #匹配任意非数字的字符 \B #匹配不是单词开头或结束的位置 [^x] #匹配除了x以外的任意字符 [^kgc] #匹配除了kgc 这几个字母以外的任意字符
5,rewrite flag 使用介绍
利用nginx的rewrite的指令,可以实现url的重新跳转,rewrtie有四种不同的flag,分别是redirect(临时重定向302)、permanent(永久重定向301)、break和last。其中前两种是跳转型的flag,后两种是代理型
- 跳转型指由客户端浏览器重新对新地址进行请求
- 代理型是在WEB服务器内部实现跳转
5.1 rewrite 格式
Syntax: rewrite regex replacement [flag]; #通过正则表达式处理用户请求并返回替换后的数据包。 Default: — Context: server, location, if
5.2 flag 说明
redirect;302
#临时重定向,重写完成后以临时重定向方式直接返回重写后生成的新URL给客户端,由客户端重新发起请求;使用相对路径,或者http://或https://开头,状态码:302 302临时跳
permanent;301
#重写完成后以永久重定向方式直接返回重写后生成的新URL给客户端,由客户端重新发起请求,状态码:301 301 永久跳
break;
#重写完成后,停止对当前URL在当前location中后续的其它重写操作,而后直接跳转至重写规则配置块之后的其它配置;结束循环,建议在location中使用
#适用于一个URL一次重写 break 一次匹配
last;
#重写完成后,停止对当前URI在当前location中后续的其它重写操作,而后对新的URL启动新一轮重写检查,不建议在location中使用
#适用于一个URL多次重写,要注意避免出现超过十次以及URL重写后返回错误的给用户301
last 多次匹配
6, 示例
6.1 bj 跳beijing
此处的$1代表后项引用
客户机访问可以看到 状态码先后经历301 和200
6.2 http 转https
#也可以针对特定的URL进行跳转https
location /login { #针对特定的URL进行跳转https if ($scheme = http ){ #如果没有加条件判断,会导致死循环 rewrite / https://$host/login redirect; } }
6.3 break 与last区别展示
当把 主站点目录删了 break匹配一次 ,找不到文件 返回404
return 多次匹配 最后返回403
6.4 其他例子
6.5 rewrite 优先级问题
客户机访问/bj/ 为什么匹配不了location 里面的root ?
解释:
第一次请求报文 匹配到了locationd的跟 然后重定向新的URL:/beijing
第二次请求报文 匹配的根从配置文件中重新读取为server语句块的根/beijing
而且还有优先级的问题
二,防盗链
(一)referer介绍
防盗链基于客户端携带的referer实现,referer是记录打开一个页面之前记录是从哪个页面跳转过来的标记信息,如果别人只链接了自己网站图片或某个单独的资源,而不是打开了网站的整个页面,这就是盗链,referer就是之前的那个网站域名,正常的referer信息有以下几种:
none | #请求报文首部没有referer首部,比如用户直接在浏览器输入域名访问web网站,就没有referer信息。 |
blocked | #请求报文有referer首部,但无有效值,比如为空 |
server_names | #referer首部中包含本主机名及即nginx 监听的server_name。 域名和我一样 合法(本站跳转) |
arbitrary_string | #自定义指定字符串,但可使用*作通配符。示例: *.kgc.org www.kgc.* 兄弟网站 |
regular expression | #被指定的正则表达式模式匹配到的字符串,要使用~开头,例如:~.*\.kgc\.com |
(二) 实现盗猎
1, 实验环境
192.168.217.77 机器是httpd 盗猎 192.168.217.66机器的图
2, 77 机器配置
在主目录写index.html 图片来源 www.shouji.com
77 电脑 的host 文件也加上 www.shouji.com 的域名
3, 66 机器 配置
当域名为 www.shouji.com 时 主目录下要有 a.jpg
即 /data/html/a.jpg
注意:有一个容易出错的地方 原来的图片最好也要jpg的格式
4, 真机访问 77 机器 可以看到 77的图片来源是66的
(三) 实现防盗链
1, 返回403
66机器上写配置:
具体解释:
~* \.(jpg|gif|swf)$:这段正则表达式表示匹配不区分大小写,以.jpg 或.gif 或.swf 结尾的文件
Valid_referers:设置信任的网站,可以正常使用图片。
None :浏览器中 referer 为空的情况,就是直接在浏览器访问图片。
Blocked :referer 不为空的情况 ,但是值被代理或防火墙删除了,这些值不以 http://或https://开头。后面的网址或者域名:referer 中包含相关字符串的网址。
If 语句:如果链接的来源域名不在 valid_referers 所列出的列表中,$invalid_referer 为1,则执行后面的操作,即进行重写或返回 403 页面。
真机再次访问77机器 发现66的图片看不了了
2, 返回指定内容
66机器上写配置:
真机再次访问77机器:
三 , 其他相关高级功能
1, 自动生成nginx 配置文件
https://www.digitalocean.com/community/tools/nginx
2,第三方模块
3,lua 帮助
Lua 教程 | 菜鸟教程
先装lua 再装第三方模块(可以装很多第三方模块)