Django框架 querySet功能解析


Posted in Python onSeptember 04, 2019

可切片

使用Python 的切片语法来限制查询集记录的数目 。它等同于SQL 的LIMIT 和OFFSET 子句。

>>> Entry.objects.all()[:5] # (LIMIT 5)
Entry.objects.all()[5:10] # (OFFSET 5 LIMIT 5)

不支持负的索引(例如Entry.objects.all()[-1])。通常,查询集 的切片返回一个新的查询集 —— 它不会执行查询。

 

可迭代

articleList=models.Article.objects.all()
for article in articleList:
  print(article.title) 

惰性查询

查询集 是惰性执行的 —— 创建查询集不会带来任何数据库的访问。你可以将过滤器保持一整天,直到查询集 需要求值时,Django 才会真正运行这个查询。

queryResult=models.Article.objects.all() # not hits database
print(queryResult) # hits database 
for article in queryResult:
  print(article.title)  # hits database

一般来说,只有在“请求”查询集 的结果时才会到数据库中去获取它们。当你确实需要结果时,查询集 通过访问数据库来求值。 关于求值发生的准确时间,参见何时计算查询集。

缓存机制

每个查询集都包含一个缓存来最小化对数据库的访问。理解它是如何工作的将让你编写最高效的代码。

在一个新创建的查询集中,缓存为空。首次对查询集进行求值 —— 同时发生数据库查询 ——Django 将保存查询的结果到查询集的缓存中并返回明确请求的结果(例如,如果正在迭代查询集,则返回下一个结果)。接下来对该查询集 的求值将重用缓存的结果。

请牢记这个缓存行为,因为对查询集使用不当的话,它会坑你的。例如,下面的语句创建两个查询集,对它们求值,然后扔掉它们:

print([a.title for a in models.Article.objects.all()])
print([a.create_time for a in models.Article.objects.all()])

这意味着相同的数据库查询将执行两次,显然倍增了你的数据库负载。同时,还有可能两个结果列表并不包含相同的数据库记录,因为在两次请求期间有可能有Article被添加进来或删除掉。为了避免这个问题,只需保存查询集并重新使用它: 

queryResult=models.Article.objects.all()
print([a.title for a in queryResult])
print([a.create_time for a in queryResult])

何时查询集不会被缓存?

查询集不会永远缓存它们的结果。当只对查询集的部分进行求值时会检查缓存, 如果这个部分不在缓存中,那么接下来查询返回的记录都将不会被缓存。所以,这意味着使用切片或索引来限制查询集将不会填充缓存。

例如,重复获取查询集对象中一个特定的索引将每次都查询数据库:

>>> queryset = Entry.objects.all()
>>> print queryset[5] # Queries the database
>>> print queryset[5] # Queries the database again

然而,如果已经对全部查询集求值过,则将检查缓存:

>>> queryset = Entry.objects.all()
>>> [entry for entry in queryset] # Queries the database
>>> print queryset[5] # Uses cache
>>> print queryset[5] # Uses cache

下面是一些其它例子,它们会使得全部的查询集被求值并填充到缓存中:

>>> [entry for entry in queryset]
>>> bool(queryset)
>>> entry in queryset
>>> list(queryset)

注:简单地打印查询集不会填充缓存。

queryResult=models.Article.objects.all()
print(queryResult) # hits database
print(queryResult) # hits database 

exists()与iterator()方法

exists:

简单的使用if语句进行判断也会完全执行整个queryset并且把数据放入cache,虽然你并不需要这些 数据!为了避免这个,可以用exists()方法来检查是否有数据:

if queryResult.exists():
  #SELECT (1) AS "a" FROM "blog_article" LIMIT 1; args=()
    print("exists...")

iterator:

当queryset非常巨大时,cache会成为问题。

处理成千上万的记录时,将它们一次装入内存是很浪费的。更糟糕的是,巨大的queryset可能会锁住系统 进程,让你的程序濒临崩溃。要避免在遍历数据的同时产生queryset cache,可以使用iterator()方法 来获取数据,处理完数据就将其丢弃。

objs = Book.objects.all().iterator()
# iterator()可以一次只从数据库获取少量数据,这样可以节省内存
for obj in objs:
  print(obj.title)
#BUT,再次遍历没有打印,因为迭代器已经在上一次遍历(next)到最后一次了,没得遍历了
for obj in objs:
  print(obj.title)

当然,使用iterator()方法来防止生成cache,意味着遍历同一个queryset时会重复执行查询。所以使 #用iterator()的时候要当心,确保你的代码在操作一个大的queryset时没有重复执行查询。

总结:

queryset的cache是用于减少程序对数据库的查询,在通常的使用下会保证只有在需要的时候才会查询数据库。 使用exists()和iterator()方法可以优化程序对内存的使用。不过,由于它们并不会生成queryset cache,可能 会造成额外的数据库查询。 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python单链表实现代码实例
Nov 21 Python
对于Python的框架中一些会话程序的管理
Apr 20 Python
Python连接mysql数据库的正确姿势
Feb 03 Python
Python编程实现两个文件夹里文件的对比功能示例【包含内容的对比】
Jun 20 Python
使用Python实现简单的服务器功能
Aug 25 Python
在python3.5中使用OpenCV的实例讲解
Apr 02 Python
python实现简易内存监控
Jun 21 Python
Python3 批量扫描端口的例子
Jul 25 Python
基于spring boot 日志(logback)报错的解决方式
Feb 20 Python
解决numpy矩阵相减出现的负值自动转正值的问题
Jun 03 Python
Tensorflow与Keras自适应使用显存方式
Jun 22 Python
Python爬虫Scrapy框架CrawlSpider原理及使用案例
Nov 20 Python
Django框架 查询Extra功能实现解析
Sep 04 #Python
Django框架 Pagination分页实现代码实例
Sep 04 #Python
python 动态迁移solr数据过程解析
Sep 04 #Python
Django框架 信号调度原理解析
Sep 04 #Python
Django Admin中增加导出Excel功能过程解析
Sep 04 #Python
Django Admin中增加导出CSV功能过程解析
Sep 04 #Python
Python 自动登录淘宝并保存登录信息的方法
Sep 04 #Python
You might like
php中神奇的fastcgi_finish_request
2011/05/02 PHP
php教程 插件机制在PHP中实现方案
2012/11/02 PHP
简单谈谈php延迟静态绑定
2016/01/26 PHP
PHP基于面向对象实现的留言本功能实例
2018/04/04 PHP
PHP连续签到功能实现方法详解
2019/12/04 PHP
PHP框架实现WebSocket在线聊天通讯系统
2019/11/21 PHP
PNGHandler-借助JS让PNG图在IE下实现透明(包括背景图)
2007/08/31 Javascript
js限制文本框只能输入数字(正则表达式)
2012/07/15 Javascript
jquery获取子节点和父节点的示例代码
2013/09/10 Javascript
javascript中alert()与console.log()的区别
2015/08/26 Javascript
javascript判断复选框是否选中的方法
2015/10/16 Javascript
基于Jquery和html5的7款个性化地图插件
2015/11/17 Javascript
Bootstrap Navbar Component实现响应式导航
2016/10/08 Javascript
基于JavaScript实现熔岩灯效果导航菜单
2017/01/04 Javascript
利用策略模式与装饰模式扩展JavaScript表单验证功能
2017/02/14 Javascript
微信小程序 页面传值详解
2017/03/10 Javascript
layui实现tab的添加拒绝重复的方法
2019/09/04 Javascript
vue+layui实现select动态加载后台数据的例子
2019/09/20 Javascript
jquery将json转为数据字典的实例代码
2019/10/11 jQuery
layui form表单提交后实现自动刷新
2019/10/25 Javascript
解决在Vue中使用axios用form表单出现的问题
2019/10/30 Javascript
virtualenv实现多个版本Python共存
2017/08/21 Python
python中实现精确的浮点数运算详解
2017/11/02 Python
在Python中分别打印列表中的每一个元素方法
2018/11/07 Python
Python基础之高级变量类型实例详解
2020/01/03 Python
django序列化时使用外键的真实值操作
2020/07/15 Python
python 常见的反爬虫策略
2020/09/27 Python
就业自我评价
2014/02/04 职场文书
禁烟标语大全
2014/06/11 职场文书
村党支部书记四风问题个人对照检查材料思想汇报
2014/10/06 职场文书
党员群众路线剖析材料
2014/10/08 职场文书
2015年学校办公室主任工作总结
2015/07/20 职场文书
素质拓展训练感想
2015/08/07 职场文书
队列队形口号
2015/12/25 职场文书
三严三实·严以修身心得体会
2016/01/15 职场文书
MySQL运行报错:“Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggre”解决方法
2022/06/14 MySQL