讨论nginx location 顺序问题


Posted in Servers onMay 30, 2022

网上有很多讨论 nginx location 顺序的话题,得到的结论也基本一致,总结为:

  • 精准匹配 =
  • 前缀匹配 ^~
  • 正则匹配 ~~*
  • 不带修饰符的前缀匹配

在很长的一段时间里,我对上述的结论也一直深信不疑,甚至还将这个结论分享给其他小伙伴,直到在有一次配置时发现,请求 uri 明明是符合了前缀匹配 ^~ 规则,但 nginx 却没有使用,这让我对上述结论产生了疑惑。后续通过调研、实践后发现,上述结论可以说对,但也不对,是不是更疑惑了?没关系,看完这篇文章你就知道我为什么会这样说了。

本篇文章会从以下五个方面来介绍 location 顺序问题

  • location 是什么
  • location 的选项有哪些
  • location 的匹配规则是什么
  • location 的应用规则是什么
  • 总结

话不多说,我们直接进入正题。

一、location 是什么

location 翻译成中文就是定位,已经描述的比较清晰了,因为它的作用就是根据请求 uri 定位到某一个规则块,然后在由该规则块决定怎么处理用户的请求。

location 模块看起来挺简单的,但真要自己写,有时候就会觉得无从下手,我应该用 location /imageslocation ^~ /images 还是 location ~ /images 呢?我应该帮这个location 规则放在什么位置呢?将规则放在最前面会影响已有的配置吗?....上面说的问题,相信大部分同学都遇到过,想要彻底解决,就必须要了解 location 的处理逻辑,当然这也是本篇文章的目的所在。

二、location 的选项有哪些?

location [ = | ~ | ~* | ^~ ] uri { ... }

按照匹配模式进行区分,location 后可以放置两种类型的匹配规则,分别是前缀字符串(prefix string)和正则表达式(regular expression)。其中前缀字符串包括 =^~ 以及不设置(也就是空串),而正则表达式只有 ~~*。(这五种选项是经常看到的,还有一种不常用的 location @name { ... } ,并不在今天的讨论范围)

三、location 的匹配规则

只有请求 uri 满足 location 的规则,才有可能被应用,而对于不同的匹配模式,location 的匹配规则也是不同的

前缀字符串

顾名思义,它表示从请求 uri 的开头开始进行匹配,如果用 JavaScript 来描述的话,当 uri.indexOf(locationRule.uri) === 0 时表示满足匹配规则,其中 uri 表示请求路径,而 locationRule.uri 表示 location 设置的规则。

其中 = 选项比较特殊,它又叫做精准匹配,只有匹配规则与请求 uri 完全相等时才表示满足条件,即只有当 uri === locationRule.uri 时才表示匹配成功。

正则表达式

其实就是通过正则匹配来验证是否满足规则,nginx 使用的是 Perl 兼容正则表达式 (PCRE),网上可以找到很多验证正则表达式的站点,这里就不再展开了。但要注意,为了方便配置,nginx 进行了一些非标准的优化,例如,不必像在标准正则表达式中那样转义 URL 中的正斜杠(/)等等。

而对于 ~~* 唯一的区别就是:~ 区分大小写,而 ~* 不区分大小写。

总结

下面,我们对 location 的选项进行一个简单的总结

选项 匹配规则 示例
= 精准匹配 location = /test {...}
^~ 从请求 uri 的开头进行匹配 location ^~ /test {...}
[空串] 从请求 uri 的开头进行匹配 location /test {...}
~ 区分大小写的正则匹配 location ~ /test {...}
~* 不区分大小写的正则匹配 location ~* /test {...}

四、location 的应用规则

理论篇

在了解完匹配规则后,我们来看下 nginx 是如何应用这些规则的,这就要说到 location 的顺序问题了。

下面是根据实践以文档总结出来的 location 应用规则的逻辑:

  • server 块中的 location 按照匹配模式分成两个列表,分别为前缀字符串规则列表和正则匹配规则列表。
  • 首先遍历前缀字符串规则列表,当满足匹配的规则是精准匹配时(即匹配选项是 =),直接应用该规则,结束流程;否则找到匹配规则最长的那条记录(记作 maxLenthStringPrefixRule),继续执行逻辑3;
  • 如果 maxLenthStringPrefixRule 存在且匹配选项是 ^~ ,应用该规则,结束流程;否则,执行逻辑4;
  • 遍历正则匹配规则列表,如果满足匹配规则,则直接应用,流程结束;如果直到循环结束后依然没有满足规则的 location,则执行逻辑5;
  • 如果 maxLenthStringPrefixRule 存在,则应用该规则,流程结束;如果没有则返回 404,同样结束流程。

如果上述描述看着很难理解,可以尝试看下面的伪代码。

// 字符串匹配的规则集合,按照在 .conf 文件中的顺序放置到该集合中
const stringPrefixRuleList = [...]
// 正则匹配的规则集合,按照在 .conf 文件中的顺序放置到该集合中
const regularExpressionRuleList = [...]
// 用于存放最长字符串匹配的规则
let maxLenthStringPrefixRule;
// 遍历字符串匹配的规则集合
for (let stringPrefixRule of stringPrefixRuleList) {
    // 符合匹配规则
    if (stringPrefixRule.isMatched()) {
        // 匹配选项是精准匹配
        if (stringPrefixRule.option === '=') {
            // 应用该规则,结束流程
            applyRule(stringPrefixRule);
            return;
        }
        // 将最长匹配规则记录下来,留到后面使用
        if (!maxLenthStringPrefixRule 
            || stringPrefixRule.uri.length > maxLenthStringPrefixRule.uri.length) {
            maxLenthStringPrefixRule = stringPrefixRule
        }
    }
}
// 如果最长匹配规则的选项是 ^~, 则应用该规则,流程结束
if (maxLenthStringPrefixRule && maxLenthStringPrefixRule.option === '^~') {
    applyRule(maxLenthStringPrefixRule);
    return;
}
// 遍历正则匹配规则集合
for (let regularExpressionRule of regularExpressionRuleList) {
    // 如果有规则匹配上,则直接应用,流程结束
    if (regularExpressionRule.isMatched()) {
        applyRule(regularExpressionRule);
        return;
    }
}
// 如果最长字符串匹配的规则存在,则应用该规则
if (maxLenthStringPrefixRule) {
    applyRule(maxLenthStringPrefixRule);
    return;
}
// 404,规则未找到
throw new Error(404)

由此,我们可以得到几个结论:

  • 命中 = 匹配规则后会终止搜索,并直接使用该规则。所以,如果某个请求 url 频繁发生,例如 /,我们可以在 nginx.conf 中添加 location = / 规则,这会加速这些请求的处理速度,因为在命中规则后会终止搜索。
  • ^~ 和空串的前缀匹配,区别在于,如果命中 ^~ 的规则,并且是最长前缀匹配,就会终止搜索正则匹配规则列表。
  • 除了命中精准匹配外,前缀字符串匹配列表都会被遍历一遍,并且找到最长匹配的那条 location 规则,所以前缀字符串匹配和在文件中的位置无关,但是和匹配长度有关
  • 由于正则匹配的时间、资源消耗较多,所以 nginx 在对 location 规则进行正则匹配时,命中一个就直接使用了,所以正则匹配和 location 规则在文件中的位置有关

实践篇

从上面的理论篇中,大家应该能大致了解到 nginx 是如何命中 location 规则的,为了加深大家记忆,同时也为了能佐证理论是对的,我们来一些实践吧。

我们的模板是这样的,后面所有的实践内容,都是放到两个 rule section 之间。

server {
    listen	9001;
    location / {
        default_type text/html;
        return 200 'hello world';
    }
    # ===== rule section ======
    # ===== rule section ======

精准匹配优先级最高

location /test {
    default_type text/html;
    return 200 '/test';
}

location ~ /test {
   default_type text/html;
   return 200 '~ /test';
}

location = /test {
   default_type text/html;
   return 200 '= /test';
}

我们在 nginx.conf 放置了 /test~ /test= /test 三个 location 规则,随后在浏览器输入 localhost:9001/test,发现输出内容是 = /test,符合我们的预期,= 选项的优先级最高。

正则匹配和顺序有关

location ~ /test {
   default_type text/html;
   return 200 '~ /test';
}

location ~ /test/*/demo {
   default_type text/html;
   return 200 '~ /test/*/demo';
}

随后我们将 rule section 区块替换成 ~ /test~ /test/*/demo 规则,在浏览器输入 localhost:9001/test/xyz/demo,从正则角度来说,/test/xyz/demo 既满足 /test规则,又满足 /test/*/demo 规则,但是由于 ~ /test 在文件中位置靠前,所以优先被命中,理论上应该会输出 ~ /test,校验后发现,确实是这样。

正则、^~前缀匹配、空前缀匹配混搭

location ^~ /test {
   default_type text/html;
   return 200 '^~ /test';
}
location /test/more/andmore {
   default_type text/html;
   return 200 '/test/more/andmore';
}
location ~ /test {
   default_type text/html;
   return 200 '~ /test';
}

将 section rule 区域替换成上述内容,然后在浏览器中输入 localhost:9001/test/more/andmore,猜猜会发生什么?

我们来一起分析下:

  • 没有精准匹配的规则
  • 找到最长的前缀字符串匹配规则是 /test/more/andmore,它不是 ^~ 选项,所以会遍历正则匹配规则
  • 发现 ~ /test 满足匹配规则,直接应用该规则,所以会输出 location ~ /test 规则块的内容,也就是 ~ /test

我们再来试一下,在浏览器输入 localhost:9001/test/more,会显示什么呢?

  • 没有精准匹配规则
  • 最长前缀字符串匹配规则是 ^~ /test,是 ^~ 选项,所以不用遍历正则匹配规则列表,所以页面会显示 ^~ /test

通过校验后发现,上述分析的结果和实际显示结果是一样的。

上面几个实践都比较简单,大家也可以尝试各种组合,然后按照上面的分析步骤来检验下自己是不是真的理解了 location

五、总结

看完上面的介绍,相信大家对 location 规则的处理逻辑都有一定的了解,也应该明白为什么在文章开头说曾经看到的结论对、也不对了。

如果要用对 location 顺序进行总结的话,可以在原有的基础上适当的进行一些扩展:

  • 精准匹配 =
  • 前缀匹配 ^~如果该前缀匹配是最长前缀匹配规则,则应用
  • 正则匹配 ~~*和该规则在文件中的顺序有关,执行顺序从上到下
  • 不带修饰符的前缀匹配,和匹配规则的长度有关,只会应用最长的匹配规则,与在文件中的顺序无关

参考链接:nginx.org/en/docs/htt…

到此这篇关于nginx location 顺序问题的文章就介绍到这了!


Tags in this post...

Servers 相关文章推荐
Apache压力测试工具的安装使用
Mar 31 Servers
使用nginx动态转换图片大小生成缩略图
Mar 31 Servers
nginx反向代理时如何保持长连接
Mar 31 Servers
fastdfs+nginx集群搭建的实现
Mar 31 Servers
Kubernetes中Deployment的升级与回滚
Apr 01 Servers
Linux、ubuntu系统下查看显卡型号、显卡信息详解
Apr 07 Servers
Windows server 2012 配置Telnet以及用法详解
Apr 28 Servers
docker compose 部署 golang 的 Athens 私有代理问题
Apr 28 Servers
如何Tomcat中使用ipv6地址
May 06 Servers
聊聊配置 Nginx 访问与错误日志的问题
May 25 Servers
Nginx配置使用详解
Jul 07 Servers
nginx静态资源的服务器配置方法
Jul 07 Servers
项目中Nginx多级代理是如何获取客户端的真实IP地址
May 30 #Servers
nginx rewrite功能使用场景分析
May 30 #Servers
Nginx静态压缩和代码压缩提高访问速度详解
May 30 #Servers
Nginx 配置 HTTPS的详细过程
May 30 #Servers
关于windows server 2012 DC 环境 重启后蓝屏代码:0xc00002e2的问题
May 25 #Servers
聊聊配置 Nginx 访问与错误日志的问题
May 25 #Servers
利用nginx搭建RTMP视频点播、直播、HLS服务器
You might like
一个取得文件扩展名的函数
2006/10/09 PHP
php中session定期自动清理的方法
2015/11/12 PHP
自制PHP框架之设计模式
2017/05/07 PHP
Laravel 中使用 Vue.js 实现基于 Ajax 的表单提交错误验证操作
2017/06/30 PHP
浅谈Laravel核心解读之Console内核
2018/12/02 PHP
利用javascript查看html源文件
2006/11/08 Javascript
jquery last-child 列表最后一项的样式
2010/01/22 Javascript
我遇到的参数传递中 双引号单引号嵌套问题
2010/02/11 Javascript
网页上的Javascript编辑器和代码格式化
2010/04/25 Javascript
js函数调用常用方法详解
2012/12/03 Javascript
ext前台接收action传过来的json数据示例
2014/06/17 Javascript
JavaScript插件化开发教程 (三)
2015/01/27 Javascript
jQuery实现的简洁下拉菜单导航效果代码
2015/08/26 Javascript
详解Angularjs 如何自定义Img的ng-load 事件
2017/02/15 Javascript
Node.js readline 逐行读取、写入文件内容的示例
2018/03/01 Javascript
JS通过位运算实现权限加解密
2018/08/14 Javascript
Vue Object.defineProperty及ProxyVue实现双向数据绑定
2020/09/02 Javascript
.netcore+vue 实现压缩文件下载功能
2020/09/24 Javascript
解决Python一行输出不显示的问题
2018/12/03 Python
在Pycharm terminal中字体大小设置的方法
2019/01/16 Python
python制作抖音代码舞
2019/04/07 Python
python3下载抖音视频的完整代码
2019/06/05 Python
python模块常用用法实例详解
2019/10/17 Python
通过实例简单了解Python sys.argv[]使用方法
2020/08/04 Python
Juicy Couture Beauty官方网站:香水和化妆品
2019/03/12 全球购物
大众服装店创业计划书范文
2014/01/01 职场文书
女子职高个人自荐书
2014/02/01 职场文书
大学生学年自我鉴定
2014/02/10 职场文书
《去年的树》教学反思
2014/04/11 职场文书
2014新生大学四年计划书
2014/09/21 职场文书
教师辞职信范文
2015/02/28 职场文书
2015年社会实践个人总结
2015/03/06 职场文书
综治目标管理责任书
2015/05/11 职场文书
阿凡达观后感
2015/06/10 职场文书
环保建议书范文
2015/09/14 职场文书
Lombok的详细使用及优缺点总结
2021/07/15 Java/Android