转载:https://segmentfault.com/a/1190000002797606
http://www.cnblogs.com/lidabo/p/4169396.html
nginx 配置文件,自下到上分为三种层次分明的结构:
| http block the protocol level
| server block the server level
V location block the requested URI
Nginx 允许用户定义 Location block ,并指定一个匹配模式(pattern)匹配特定的 URI。除了简单的字符串(比如文件系统路径),还允许使用更为复杂的匹配模式(pattern)。
Location block 的基本语法形式是:
location [=|~|~*|^~|@] pattern { ... }
[=|~|~*|^~|@] 被称作 location modifier ,这会定义 Nginx 如何去匹配其后的 pattern ,以及该 pattern 的最基本的属性(简单字符串或正则表达式)。
location正则写法
location = / {
# 精确匹配 / ,主机名后面不能带任何字符串
[ configuration A ]
}
location / {
# 因为所有的地址都以 / 开头,所以这条规则将匹配到所有请求
# 但是正则和最长字符串会优先匹配
[ configuration B ]
}
location /documents/ {
# 匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索
# 只有后面的正则表达式没有匹配到时,这一条才会采用这一条
[ configuration C ]
}
location ~ /documents/Abc {
# 匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索
# 只有后面的正则表达式没有匹配到时,这一条才会采用这一条
[ configuration CC ]
}
location ^~ /images/ {
# 匹配任何以 /images/ 开头的地址,匹配符合以后,停止往下搜索正则,采用这一条。
[ configuration D ]
}
location ~* \.(gif|jpg|jpeg)$ {
# 匹配所有以 gif,jpg或jpeg 结尾的请求
# 然而,所有请求 /images/ 下的图片会被 config D 处理,因为 ^~ 到达不了这一条正则
[ configuration E ]
}
location /images/ {
# 字符匹配到 /images/,继续往下,会发现 ^~ 存在
[ configuration F ]
}
location /images/abc {
# 最长字符匹配到 /images/abc,继续往下,会发现 ^~ 存在
# F与G的放置顺序是没有关系的
[ configuration G ]
}
location ~ /images/abc/ {
# 只有去掉 config D 才有效:先最长匹配 config G 开头的地址,继续往下搜索,匹配到这一条正则,采用
[ configuration H ]
}
location ~* /js/.*/\.js
- 已=开头表示精确匹配
- 如 A 中只匹配根目录结尾的请求,后面不能带任何字符串。
- ^~ 开头表示uri以某个常规字符串开头,不是正则匹配
- ~ 开头表示区分大小写的正则匹配;
- ~* 开头表示不区分大小写的正则匹配
- / 通用匹配, 如果没有其它匹配,任何请求都会匹配到
顺序 no优先级: (location =) > (location 完整路径) > (location ^~ 路径) > (location ~,~* 正则顺序) > (location 部分起始路径) > (/)
上面的匹配结果 按照上面的location写法,以下的匹配示例成立:
-
/ -> configuration A
精确完全匹配,即使/index.html也匹配不了
-
/downloads/download.html -> configuration B
匹配B以后,往下没有任何匹配,采用B
-
/images/1.gif -> configuration D
匹配到F,往下匹配到D,停止往下
-
/images/abc/def -> configuration D
最长匹配到G,往下匹配D,停止往下
你可以看到 任何以/images/开头的都会匹配到D并停止,FG写在这里是没有任何意义的,H是永远轮不到的,这里只是为了说明匹配顺序
-
/documents/document.html -> configuration C
匹配到C,往下没有任何匹配,采用C
-
/documents/1.jpg -> configuration E
匹配到C,往下正则匹配到E
-
/documents/Abc.jpg -> configuration CC
最长匹配到C,往下正则顺序匹配到CC,不会往下到E
[ configuration A ] 精准匹配
这会完全匹配指定的 pattern ,且这里的 pattern 被限制成简单的字符串,也就是说这里不能使用正则表达式。
server {
server_name website.com;
location = /abcd {
[…]
}
}
匹配情况:
- http://website.com/abcd # 正好完全匹配
- http://website.com/ABCD # 如果运行 Nginx server 的系统本身对大小写不敏感,比如 Windows ,那么也匹配
- http://website.com/abcd?param1¶m2 # 忽略查询串参数(query string arguments),这里就是 /abcd 后面的 ?param1¶m2
- http://website.com/abcd/ # 不匹配,因为末尾存在反斜杠(trailing slash),Nginx 不认为这种情况是完全匹配
- http://website.com/abcde # 不匹配,因为不是完全匹配
[ configuration B ] 精准匹配
可以不写 location modifier ,Nginx 仍然能去匹配 pattern 。这种情况下,匹配那些以指定的 patern 开头的 URI,注意这里的 URI 只能是普通字符串,不能使用正则表达式。
server {
server_name website.com;
location /abcd {
[…]
}
}
匹配情况:
- http://website.com/abcd # 正好完全匹配
- http://website.com/ABCD # 如果运行 Nginx server 的系统本身对大小写不敏感,比如 Windows ,那么也匹配
- http://website.com/abcd?param1¶m2 # 忽略查询串参数(query string arguments),这里就是 /abcd 后面的 ?param1¶m2
- http://website.com/abcd/ # 末尾存在反斜杠(trailing slash)也属于匹配范围内
- http://website.com/abcde # 仍然匹配,因为 URI 是以 pattern 开头的
[ configuration CC ] 正则匹配(区分大小写)
这个 location modifier 对大小写敏感,且 pattern 须是正则表达式
server {
server_name website.com;
location ~ ^/abcd$ {
[…]
}
}
匹配情况:
- http://website.com/abcd # 完全匹配
- http://website.com/ABCD # 不匹配,~ 对大小写是敏感的
- http://website.com/abcd?param1¶m2 # 忽略查询串参数(query string arguments),这里就是 /abcd 后面的 ?param1¶m2
- http://website.com/abcd/ # 不匹配,因为末尾存在反斜杠(trailing slash),并不匹配正则表达式 ^/abcd$
- http://website.com/abcde # 不匹配正则表达式 ^/abcd$
注意:对于一些对大小写不敏感的系统,比如 Windows ,~ 和 ~* 都是不起作用的,这主要是操作系统的原因。
[ configuration CD ] 正则匹配(不区分大小写)
与 ~ 类似,但这个 location modifier 不区分大小写,pattern 须是正则表达式
server {
server_name website.com;
location ~* ^/abcd$ {
[…]
}
}
匹配情况:
- http://website.com/abcd # 完全匹配
- http://website.com/ABCD # 匹配,这就是它不区分大小写的特性
- http://website.com/abcd?param1¶m2 # 忽略查询串参数(query string arguments),这里就是 /abcd 后面的 ?param1¶m2
- http://website.com/abcd/ # 不匹配,因为末尾存在反斜杠(trailing slash),并不匹配正则表达式 ^/abcd$
- http://website.com/abcde # 不匹配正则表达式 ^/abcd$
实际使用建议
所以实际使用中,个人觉得至少有三个匹配规则定义,如下:
#直接匹配网站根,通过域名访问网站首页比较频繁,使用这个会加速处理,官网如是说。
#这里是直接转发给后端应用服务器了,也可以是一个静态首页
# 第一个必选规则
location = / {
proxy_pass http://tomcat:8080/index
}
# 第二个必选规则是处理静态文件请求,这是nginx作为http服务器的强项
# 有两种配置模式,目录匹配或后缀匹配,任选其一或搭配使用
location ^~ /static/ {
root /webroot/static/;
}
location ~* \.(gif|jpg|jpeg|png|css|js|ico)$ {
root /webroot/res/;
}
#第三个规则就是通用规则,用来转发动态请求到后端应用服务器
#非静态文件请求就默认是动态请求,自己根据实际把握
#毕竟目前的一些框架的流行,带.php,.jsp后缀的情况很少了
location / {
proxy_pass http://tomcat:8080/
}
普通匹配和正则匹配优先级:
如果我们访问:http://127.0.0.1:8080/image/aiai.png
此时, “/” 与”/image/aiai.png” 匹配,同时,”image”正则 与”image/logo.png”也能匹配,谁发挥作用?
答案:正则表达式的成果将会使用!
location / {
root D:\wnmp\www\html;
index index.html index.htm index.php;
}
location ~ image {
root D:\wnmp\www; //在这里要注意了,如果location 正则写image了则的 root 路径中不可以在次写image
index index.html;
}
图片真正会访问:D:\wnmp\www\image\aiai.png (而不是:D:\wnmp\www\html\image\aiai.png)
普通长短优先级
我们访问 http://127.0.0.1:8080/foo
location / {
root /usr/local/nginx/html;
index index.html index.htm;
}
location /foo {
root /var/www/html;
index index.html;
}
对于uri “/foo”, 两个location的patt,都能匹配他们,即 ‘/’能从左前缀匹配 ‘/foo’, ‘/foo’也能左前缀匹配’/foo’,此时, 真正访问 /var/www/html/index.html 原因:’/foo’匹配的更长,因此使用之:
location ~ /hls123/(\d+).m3u8$ {
#设置nginx变量
set $a $1;
echo $a "::a = : ${a}";
}
curl "http://localhost/hls123/4001489370813.m3u8"
4001489370813 ::a = : 4001489370813
以上的这种是可以是接受参数的 $1 就是这参数
location ~ \/.+\/.+\.(m3u8|ts) {
#设置nginx变量
if ($uri ~ \/([a-zA-Z0-9]+)\/([a-zA-Z0-9]+)(|-).*\.(m3u8|ts)) {
set $app_name $1;
set $a $2;
}
echo "::document = : ${document_uri}";
echo "::uri = : ${uri}";
echo "::app_name = : ${app_name}";
echo "::stream_name = : ${a}";
#set $stream_id "";
#default_type 'text/html';
#lua_code_cache off;
#rewrite_by_lua_file /home/www/lua-tinywan/set_by_file.lua;
#echo "stream_id :" $stream_id;
#proxy_pass $stream_id;
}
curl "http://localhost/hls123/4001489370813.m3u8"
::document = : /hls123/4001489370813.m3u8
::uri = : /hls123/4001489370813.m3u8
::app_name = : hls123
::stream_name = : 4001489370813
可以使用上面的这个方法获取需要的参数(不会)