编程 Python

记一次django内存异常排查及解决方法

Posted in Python onAugust 07, 2020

起因

Django 作为 Python著名的Web框架，相信很多人都在用，自己工作中也有项目项目在用，而在最近几天的使用中发现，部署Django程序的服务器出现了内存问题，现象就是运行一段时间之后，内存占用非常高，最终会把服务器的内存耗尽，对于Python项目出现内存问题，自己之前处理过一次，所以并没有第一次解决时的慌张，自己之前把解决方法也整理了：https://3water.com/article/151604.htm

但是事情似乎并没有我想的那么简单，自己尝试用之前的的方法tracemalloc库进行问题的排查，但是问题来了实际的项目中有快一百多个接口，怎么排查？难道一个一个接口进行测试排查，但是时间又比较紧急，可能又来不及了。对比上次自己解决是因为上次的项目比较简单，相对来说定位问题比较容易，那么这次怎么处理呢？

处理过程

一般Python项目其实是很少出现内存问题的，一般都是自己代码写的有问题导致的，而对于这次出现的问题，自己的排查思路（对于web 接口类型的项目）：

先排查调用比较频繁的接口
然后排查数据汇总接口（查询比较复杂）
如果上述还没有查出来，再排查剩余的接口

在这次的问题排查中，自己大致也是按照这个思路进行的，在对调用频繁的接口进行排查时，并没有发现内存的异常，而出现内存的问题则是在数据汇总的相关接口上。

其实这种接口对于初级开发可能是容易出问题的地方，首先这种接口查询的数据相对其他接口会比较复杂，如果编码基础又不是特别好，可能就会在这些接口上出现bug.

而在这次的排查中，最终确定是在一个汇总数据的接口上，定位到问题处在了Django ORM 使用不当导致的。自己通过一个简单代码实例来说明：

class Student(models.Model):
 name = models.CharField(max_length=20)
 name2 = models.CharField(max_length=20)
 name3 = models.CharField(max_length=20)
 name4 = models.CharField(max_length=20)
 name5 = models.CharField(max_length=20)
 name6 = models.CharField(max_length=20)
 name7 = models.CharField(max_length=20)
 name8 = models.CharField(max_length=20)
 name9 = models.CharField(max_length=20)
 name10 = models.CharField(max_length=20)
 name11 = models.CharField(max_length=20)
 name12 = models.CharField(max_length=20)
 name13 = models.CharField(max_length=20)
 name14 = models.CharField(max_length=20)
 name15 = models.CharField(max_length=20)
 age = models.IntegerField(default=0)

正常情况，我们的表字段会比较多，这里就通过多个name来模拟，出现题的代码就出在关于这个表的接口上：

def index(request):
 studets = Student.objects.filter(age__gt=20)
 if studets:
  pass
 return HttpResponse("test memory")

为了让内存问题容易复现，我通过脚本向Student中插入了20000条数据，当然这里数据越多，问题越明显

通过一个测试脚本并发请求这个接口，观察内存情况，你会发现，内存会出现瞬间上涨的情况，并且如果你的数据越多，请求越多，你的内存可能会在一段时间居高不下，并且逐渐上涨。问题出在哪里了？

其实很简单，问题出在了代码中的if 判断那里，我们通过filter 查询返回的是QuerySet 类型的数据，而我们过滤之后的数据可能会存在非常多的时候，这个时候我们通过if 直接判断，自己的理解这个地方会将整个QuerySet加载到内存中，从而出现内存占用过高的问题，而如果并且这个时候这个接口的响应速度也是非常会变慢，而这个QuerySet 中的数据越多，内存占用越明显。

在Django的文档中其实做了说明

exists()¶
Returns True if the QuerySet contains any results, and False if not. This tries to perform the query in the simplest and fastest way possible, but it does execute nearly the same query as a normal QuerySet query.

exists() is useful for searches relating to both object membership in a QuerySet and to the existence of any objects in a QuerySet, particularly in the context of a large QuerySet.

The most efficient method of finding whether a model with a unique field (e.g. primary_key) is a member of a QuerySet is:

entry = Entry.objects.get(pk=123)
if some_queryset.filter(pk=entry.pk).exists():
 print("Entry contained in queryset")

Which will be faster than the following which requires evaluating and iterating through the entire queryset:

if entry in some_queryset:
 print("Entry contained in QuerySet")

And to find whether a queryset contains any items:

if some_queryset.exists():
 print("There is at least one object in some_queryset")

Which will be faster than:

if some_queryset:
 print("There is at least one object in some_queryset")

… but not by a large degree (hence needing a large queryset for efficiency gains).

Additionally, if a some_queryset has not yet been evaluated, but you know that it will be at some point, then using some_queryset.exists() will do more overall work (one query for the existence check plus an extra one to later retrieve the results) than using bool(some_queryset), which retrieves the results and then checks if any were returned.

所以对于我们的代码我们只需要把if 判断地方改成if not studets.exists() 就可以解决问题。

这是一个很小的知识点，但是如果使用不对，可能就会造成非常严重的内存问题。

总结

除了单元测试，还需要做大数据量测试，这次的问题如果在测试的时候做过一定数据量的测试，可能很早就能及时发现

问题

对于基础的库的使用要更加熟悉

排查问题的思路要明确，不然可能会无从下手

延伸阅读

https://docs.djangoproject.com/en/3.0/ref/models/querysets/
https://3water.com/article/151604.htm

到此这篇关于django内存异常排查及解决方法的文章就介绍到这了,更多相关django内存异常排查内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

记一次django内存异常排查及解决方法

- Author -

syncd

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python操作xml文件示例

Apr 07 Python

python通过scapy获取局域网所有主机mac地址示例

May 04 Python

Python中装饰器学习总结

Feb 10 Python

Python实现的爬虫刷回复功能示例

Jun 07 Python

python 字典中文key处理,读取,比较方法

Jul 06 Python

可能是最全面的 Python 字符串拼接总结【收藏】

Jul 09 Python

django数据关系一对多、多对多模型、自关联的建立

Jul 24 Python

python3图片文件批量重命名处理

Oct 31 Python

python3.8与pyinstaller冲突问题的快速解决方法

Jan 16 Python

django配置app中的静态文件步骤

Mar 27 Python

详解pytorch中squeeze()和unsqueeze()函数介绍

Sep 03 Python

如何用Python和JS实现的Web SSH工具

Feb 23 Python

python正则表达式匹配反斜杠的操作方法

Aug 07 #Python

Pygame框架实现飞机大战

Aug 07 #Python

python爬取网易云音乐热歌榜实例代码

Aug 07 #Python

Python变量格式化输出实现原理解析

Aug 06 #Python

Python实现Canny及Hough算法代码实例解析

Aug 06 #Python

vscode调试django项目的方法

Aug 06 #Python

Python如何使用input函数获取输入

Aug 06 #Python

You might like

自动跳转中英文页面

2006/10/09 PHP

php下过滤html代码的函数提高程序安全性

2010/03/02 PHP

php数字游戏计算24算法

2012/06/10 PHP

在PHP模板引擎smarty生成随机数的方法和math函数详解

2014/04/24 PHP

PHP编程实现多维数组按照某个键值排序的方法小结【2种方法】

2017/04/27 PHP

jQuery.autocomplete 支持中文输入(firefox)修正方法

2011/03/10 Javascript

JQuery中对Select的option项的添加、删除、取值

2013/08/25 Javascript

jquery实现的图片点击滚动效果

2014/04/29 Javascript

Jquery easyui开启行编辑模式增删改操作

2016/01/14 Javascript

D3.js进阶系列之CSV表格文件的读取详解

2017/06/06 Javascript

详解angular 中的自定义指令之详解API

2017/06/20 Javascript

jQuery+Ajax请求本地数据加载商品列表页并跳转详情页的实现方法

2017/07/12 jQuery

bootstrap tooltips在 angularJS中的使用方法

2019/04/10 Javascript

浅入深出Vue之组件使用

2019/07/11 Javascript

vue实现Input输入框模糊查询方法

2021/01/29 Javascript

Angular封装表单控件及思想总结

2019/12/11 Javascript

JS实现简易计算器

2020/02/14 Javascript

vue+vant 上传图片需要注意的地方

2021/01/03 Vue.js

python从sqlite读取并显示数据的方法

2015/05/08 Python

python 异常处理总结

2016/10/18 Python

ubuntu系统下使用pm2设置nodejs开机自启动的方法

2018/05/12 NodeJs

解决pycharm运行时interpreter为空的问题

2018/10/29 Python

Python操作Word批量生成合同的实现示例

2020/08/28 Python

用python批量下载apk

2020/12/29 Python

html5移动端价格输入键盘的实现

2019/09/16 HTML / CSS

澳大利亚电子产品购物网站：Dick Smith

2017/02/02 全球购物

Beauty Expert美国/加拿大：购买奢侈美容产品

2018/12/05 全球购物

The Outnet亚太地区：折扣设计师时装店

2019/12/05 全球购物

乌克兰品牌化妆品和香水在线商店：Bomond

2020/01/14 全球购物

大学生最新职业生涯规划书范文

2014/01/12 职场文书

网吧消防安全制度

2014/01/28 职场文书

2014年安全生产目标责任书

2014/07/23 职场文书

四风自我剖析材料

2014/09/30 职场文书

2015年党员个人工作总结

2015/05/13 职场文书

用几道面试题来看JavaScript执行机制

2021/04/30 Javascript

JavaScript选择器函数querySelector和querySelectorAll

2021/11/27 Javascript