讨论nginx location 顺序问题


Posted in Servers onMay 30, 2022

网上有很多讨论 nginx location 顺序的话题,得到的结论也基本一致,总结为:

  • 精准匹配 =
  • 前缀匹配 ^~
  • 正则匹配 ~~*
  • 不带修饰符的前缀匹配

在很长的一段时间里,我对上述的结论也一直深信不疑,甚至还将这个结论分享给其他小伙伴,直到在有一次配置时发现,请求 uri 明明是符合了前缀匹配 ^~ 规则,但 nginx 却没有使用,这让我对上述结论产生了疑惑。后续通过调研、实践后发现,上述结论可以说对,但也不对,是不是更疑惑了?没关系,看完这篇文章你就知道我为什么会这样说了。

本篇文章会从以下五个方面来介绍 location 顺序问题

  • location 是什么
  • location 的选项有哪些
  • location 的匹配规则是什么
  • location 的应用规则是什么
  • 总结

话不多说,我们直接进入正题。

一、location 是什么

location 翻译成中文就是定位,已经描述的比较清晰了,因为它的作用就是根据请求 uri 定位到某一个规则块,然后在由该规则块决定怎么处理用户的请求。

location 模块看起来挺简单的,但真要自己写,有时候就会觉得无从下手,我应该用 location /imageslocation ^~ /images 还是 location ~ /images 呢?我应该帮这个location 规则放在什么位置呢?将规则放在最前面会影响已有的配置吗?....上面说的问题,相信大部分同学都遇到过,想要彻底解决,就必须要了解 location 的处理逻辑,当然这也是本篇文章的目的所在。

二、location 的选项有哪些?

location [ = | ~ | ~* | ^~ ] uri { ... }

按照匹配模式进行区分,location 后可以放置两种类型的匹配规则,分别是前缀字符串(prefix string)和正则表达式(regular expression)。其中前缀字符串包括 =^~ 以及不设置(也就是空串),而正则表达式只有 ~~*。(这五种选项是经常看到的,还有一种不常用的 location @name { ... } ,并不在今天的讨论范围)

三、location 的匹配规则

只有请求 uri 满足 location 的规则,才有可能被应用,而对于不同的匹配模式,location 的匹配规则也是不同的

前缀字符串

顾名思义,它表示从请求 uri 的开头开始进行匹配,如果用 JavaScript 来描述的话,当 uri.indexOf(locationRule.uri) === 0 时表示满足匹配规则,其中 uri 表示请求路径,而 locationRule.uri 表示 location 设置的规则。

其中 = 选项比较特殊,它又叫做精准匹配,只有匹配规则与请求 uri 完全相等时才表示满足条件,即只有当 uri === locationRule.uri 时才表示匹配成功。

正则表达式

其实就是通过正则匹配来验证是否满足规则,nginx 使用的是 Perl 兼容正则表达式 (PCRE),网上可以找到很多验证正则表达式的站点,这里就不再展开了。但要注意,为了方便配置,nginx 进行了一些非标准的优化,例如,不必像在标准正则表达式中那样转义 URL 中的正斜杠(/)等等。

而对于 ~~* 唯一的区别就是:~ 区分大小写,而 ~* 不区分大小写。

总结

下面,我们对 location 的选项进行一个简单的总结

选项 匹配规则 示例
= 精准匹配 location = /test {...}
^~ 从请求 uri 的开头进行匹配 location ^~ /test {...}
[空串] 从请求 uri 的开头进行匹配 location /test {...}
~ 区分大小写的正则匹配 location ~ /test {...}
~* 不区分大小写的正则匹配 location ~* /test {...}

四、location 的应用规则

理论篇

在了解完匹配规则后,我们来看下 nginx 是如何应用这些规则的,这就要说到 location 的顺序问题了。

下面是根据实践以文档总结出来的 location 应用规则的逻辑:

  • server 块中的 location 按照匹配模式分成两个列表,分别为前缀字符串规则列表和正则匹配规则列表。
  • 首先遍历前缀字符串规则列表,当满足匹配的规则是精准匹配时(即匹配选项是 =),直接应用该规则,结束流程;否则找到匹配规则最长的那条记录(记作 maxLenthStringPrefixRule),继续执行逻辑3;
  • 如果 maxLenthStringPrefixRule 存在且匹配选项是 ^~ ,应用该规则,结束流程;否则,执行逻辑4;
  • 遍历正则匹配规则列表,如果满足匹配规则,则直接应用,流程结束;如果直到循环结束后依然没有满足规则的 location,则执行逻辑5;
  • 如果 maxLenthStringPrefixRule 存在,则应用该规则,流程结束;如果没有则返回 404,同样结束流程。

如果上述描述看着很难理解,可以尝试看下面的伪代码。

// 字符串匹配的规则集合,按照在 .conf 文件中的顺序放置到该集合中
const stringPrefixRuleList = [...]
// 正则匹配的规则集合,按照在 .conf 文件中的顺序放置到该集合中
const regularExpressionRuleList = [...]
// 用于存放最长字符串匹配的规则
let maxLenthStringPrefixRule;
// 遍历字符串匹配的规则集合
for (let stringPrefixRule of stringPrefixRuleList) {
    // 符合匹配规则
    if (stringPrefixRule.isMatched()) {
        // 匹配选项是精准匹配
        if (stringPrefixRule.option === '=') {
            // 应用该规则,结束流程
            applyRule(stringPrefixRule);
            return;
        }
        // 将最长匹配规则记录下来,留到后面使用
        if (!maxLenthStringPrefixRule 
            || stringPrefixRule.uri.length > maxLenthStringPrefixRule.uri.length) {
            maxLenthStringPrefixRule = stringPrefixRule
        }
    }
}
// 如果最长匹配规则的选项是 ^~, 则应用该规则,流程结束
if (maxLenthStringPrefixRule && maxLenthStringPrefixRule.option === '^~') {
    applyRule(maxLenthStringPrefixRule);
    return;
}
// 遍历正则匹配规则集合
for (let regularExpressionRule of regularExpressionRuleList) {
    // 如果有规则匹配上,则直接应用,流程结束
    if (regularExpressionRule.isMatched()) {
        applyRule(regularExpressionRule);
        return;
    }
}
// 如果最长字符串匹配的规则存在,则应用该规则
if (maxLenthStringPrefixRule) {
    applyRule(maxLenthStringPrefixRule);
    return;
}
// 404,规则未找到
throw new Error(404)

由此,我们可以得到几个结论:

  • 命中 = 匹配规则后会终止搜索,并直接使用该规则。所以,如果某个请求 url 频繁发生,例如 /,我们可以在 nginx.conf 中添加 location = / 规则,这会加速这些请求的处理速度,因为在命中规则后会终止搜索。
  • ^~ 和空串的前缀匹配,区别在于,如果命中 ^~ 的规则,并且是最长前缀匹配,就会终止搜索正则匹配规则列表。
  • 除了命中精准匹配外,前缀字符串匹配列表都会被遍历一遍,并且找到最长匹配的那条 location 规则,所以前缀字符串匹配和在文件中的位置无关,但是和匹配长度有关
  • 由于正则匹配的时间、资源消耗较多,所以 nginx 在对 location 规则进行正则匹配时,命中一个就直接使用了,所以正则匹配和 location 规则在文件中的位置有关

实践篇

从上面的理论篇中,大家应该能大致了解到 nginx 是如何命中 location 规则的,为了加深大家记忆,同时也为了能佐证理论是对的,我们来一些实践吧。

我们的模板是这样的,后面所有的实践内容,都是放到两个 rule section 之间。

server {
    listen	9001;
    location / {
        default_type text/html;
        return 200 'hello world';
    }
    # ===== rule section ======
    # ===== rule section ======

精准匹配优先级最高

location /test {
    default_type text/html;
    return 200 '/test';
}

location ~ /test {
   default_type text/html;
   return 200 '~ /test';
}

location = /test {
   default_type text/html;
   return 200 '= /test';
}

我们在 nginx.conf 放置了 /test~ /test= /test 三个 location 规则,随后在浏览器输入 localhost:9001/test,发现输出内容是 = /test,符合我们的预期,= 选项的优先级最高。

正则匹配和顺序有关

location ~ /test {
   default_type text/html;
   return 200 '~ /test';
}

location ~ /test/*/demo {
   default_type text/html;
   return 200 '~ /test/*/demo';
}

随后我们将 rule section 区块替换成 ~ /test~ /test/*/demo 规则,在浏览器输入 localhost:9001/test/xyz/demo,从正则角度来说,/test/xyz/demo 既满足 /test规则,又满足 /test/*/demo 规则,但是由于 ~ /test 在文件中位置靠前,所以优先被命中,理论上应该会输出 ~ /test,校验后发现,确实是这样。

正则、^~前缀匹配、空前缀匹配混搭

location ^~ /test {
   default_type text/html;
   return 200 '^~ /test';
}
location /test/more/andmore {
   default_type text/html;
   return 200 '/test/more/andmore';
}
location ~ /test {
   default_type text/html;
   return 200 '~ /test';
}

将 section rule 区域替换成上述内容,然后在浏览器中输入 localhost:9001/test/more/andmore,猜猜会发生什么?

我们来一起分析下:

  • 没有精准匹配的规则
  • 找到最长的前缀字符串匹配规则是 /test/more/andmore,它不是 ^~ 选项,所以会遍历正则匹配规则
  • 发现 ~ /test 满足匹配规则,直接应用该规则,所以会输出 location ~ /test 规则块的内容,也就是 ~ /test

我们再来试一下,在浏览器输入 localhost:9001/test/more,会显示什么呢?

  • 没有精准匹配规则
  • 最长前缀字符串匹配规则是 ^~ /test,是 ^~ 选项,所以不用遍历正则匹配规则列表,所以页面会显示 ^~ /test

通过校验后发现,上述分析的结果和实际显示结果是一样的。

上面几个实践都比较简单,大家也可以尝试各种组合,然后按照上面的分析步骤来检验下自己是不是真的理解了 location

五、总结

看完上面的介绍,相信大家对 location 规则的处理逻辑都有一定的了解,也应该明白为什么在文章开头说曾经看到的结论对、也不对了。

如果要用对 location 顺序进行总结的话,可以在原有的基础上适当的进行一些扩展:

  • 精准匹配 =
  • 前缀匹配 ^~如果该前缀匹配是最长前缀匹配规则,则应用
  • 正则匹配 ~~*和该规则在文件中的顺序有关,执行顺序从上到下
  • 不带修饰符的前缀匹配,和匹配规则的长度有关,只会应用最长的匹配规则,与在文件中的顺序无关

参考链接:nginx.org/en/docs/htt…

到此这篇关于nginx location 顺序问题的文章就介绍到这了!


Tags in this post...

Servers 相关文章推荐
Linux中Nginx的防盗链和优化的实现代码
Jun 20 Servers
使用Nginx搭载rtmp直播服务器的方法
Oct 16 Servers
详解nginx location指令
Jan 18 Servers
CentOS7安装GlusterFS集群以及相关配置
Apr 12 Servers
使用Nginx的访问日志统计PV与UV
May 06 Servers
阿里云服务器Ubuntu 20.04上安装Odoo 15
May 20 Servers
zabbix配置nginx监控的实现
May 25 Servers
解决Git推送错误non-fast-forward的方法
Jun 25 Servers
Windows Server 2008配置防火墙策略详解
Jun 28 Servers
Linux中各个目录的作用与内容
Jun 28 Servers
Nginx配置使用详解
Jul 07 Servers
Centos7 Shell编程之正则表达式、文本处理工具详解
Aug 05 Servers
项目中Nginx多级代理是如何获取客户端的真实IP地址
May 30 #Servers
nginx rewrite功能使用场景分析
May 30 #Servers
Nginx静态压缩和代码压缩提高访问速度详解
May 30 #Servers
Nginx 配置 HTTPS的详细过程
May 30 #Servers
关于windows server 2012 DC 环境 重启后蓝屏代码:0xc00002e2的问题
May 25 #Servers
聊聊配置 Nginx 访问与错误日志的问题
May 25 #Servers
利用nginx搭建RTMP视频点播、直播、HLS服务器
You might like
php jq jquery getJSON跨域提交数据完整版
2013/09/13 PHP
php微信开发之上传临时素材
2016/06/24 PHP
php实现的pdo公共类定义与用法示例
2017/07/19 PHP
Laravel jwt 多表(多用户端)验证隔离的实现
2019/12/18 PHP
JavaScript 通过模式匹配实现重载
2010/08/12 Javascript
超级简单实现JavaScript MVC 样式框架
2015/03/24 Javascript
js下拉选择框与输入框联动实现添加选中值到输入框的方法
2015/08/17 Javascript
NodeJs模拟登陆正方教务
2017/04/28 NodeJs
vue中使用cropperjs的方法
2018/03/01 Javascript
如何使用three.js 制作一个三维的推箱子游戏
2020/07/29 Javascript
[03:31]DOTA2英雄基础教程 大地之灵
2013/12/17 DOTA
[27:08]完美世界DOTA2联赛PWL S2 SZ vs Rebirth 第二场 11.21
2020/11/23 DOTA
Python实现控制台进度条功能
2016/01/04 Python
详解Python nose单元测试框架的安装与使用
2017/12/20 Python
python 获取当天每个准点时间戳的实例
2018/05/22 Python
Python3导入CSV文件的实例(跟Python2有些许的不同)
2018/06/22 Python
Python批处理删除和重命名文件夹的实例
2018/07/11 Python
Python实现查询某个目录下修改时间最新的文件示例
2018/08/29 Python
符合语言习惯的 Python 优雅编程技巧【推荐】
2018/09/25 Python
python实现顺序表的简单代码
2018/09/28 Python
Python笔记之代理模式
2019/11/20 Python
Numpy与Pytorch 矩阵操作方式
2019/12/27 Python
python--shutil移动文件到另一个路径的操作
2020/07/13 Python
Python爬虫之爬取淘女郎照片示例详解
2020/07/28 Python
50个强大璀璨的CSS3/JS技术运用实例
2010/02/27 HTML / CSS
html table呈现个人简历以及单元格宽度失效的问题解决
2021/01/22 HTML / CSS
美国休闲服装品牌:Express
2016/09/24 全球购物
瑞士设计师家具和家居饰品网上商店:Bruno Wickart
2019/03/18 全球购物
SQL面试题
2013/12/09 面试题
如何开发安全的AJAX应用
2014/03/26 面试题
保密承诺书
2014/03/27 职场文书
2019年教师入党申请书
2019/06/27 职场文书
Ajax实现局部刷新的方法实例
2021/03/31 Javascript
解决thinkphp6(tp6)在状态码500下不报错,或者显示错误“Malformed UTF-8 characters”的问题
2021/04/01 PHP
Redis高并发防止秒杀超卖实战源码解决方案
2021/11/01 Redis
一起来学习Python的元组和列表
2022/03/13 Python