Django bulk_create()、update()与数据库事务的效率对比分析


Posted in Python onMay 15, 2020

下面以创建10000个对象为例进行测试:

# 用for循环挨个创建,共花费37秒
  for i in range(10000):
    name="String number %s"%i
    Record.objects.create(name=name)
 
# 用django事务只提交一次,共花费2.65秒
@transaction.commit_manually
def manual_transaction():
  for i in range(10000):
    name="String number %s"%i
    Record.objects.create(name=name)
  transaction.commit()
 
# 用bulk_create创建,共花费0.47秒
def builtin():
  insert_list =[]
  for i in range(10000):
    name="String number %s"%i
    insert_list.append(Record(name=name))
  Record.objects.bulk_create(insert_list)
 
# 用for循环挨个更新,共花费72秒:
def auto_transaction():
  for record inRecord.objects.all():
    record.name ="String without number"
    record.save()
 
# 用django事务只提交一次,共花费17秒
@transaction.commit_manually
def manual_transaction():
  for record inRecord.objects.all():
    record.name ="String without number"
    record.save()
  transaction.commit()
 
# 用update更新,共花费0.33秒
def builtin():
  Record.objects.all().update(name="String without number")

补充知识:django的model使用上容易遇到的坑,default=datetime.now和auto_now、null和blank、save和update、bulk_create

一、django设置字段动态默认时间的四种方式:

from django.db import models
from datetime import datetime

class User(models.Model):
  id = models.BigAutoField('主键', primary_key=True)
 
  name = models.CharField('名字', max_length=20, db_index=True, default='')
 
  create_time_one = models.DateTimeField('创建时间', default=datetime.now())
  update_time_one = models.DateTimeField('更新时间', default=datetime.now)
 
  create_time_tow = models.DateTimeField('创建时间', auto_now_add=True)
  update_time_tow = models.DateTimeField('更新时间', auto_now=True)

1. default=datetime.now()

model每次初始化,都会自动设置该字段的默认值为初始化时间。

2. default=datetime.now

model每次进行新增或修改操作,都会自动设置该字段的值为操作时间。设置后仍可以使用ORM手动修改该字段。

3. auto_now_add=True

默认值为False,若设置为True,model每次进行新增操作,都会自动设置该字段的值为操作时间。设置为True后无法使用ORM手动修改该字段,哪怕填充了字段的值也会被覆盖。

4. auto_now=True

默认值为False,若设置为True,model每次进行新增或修改操作,都会自动设置该字段的值为操作时间。设置为True后无法使用ORM手动修改该字段,哪怕填充了字段的值也会被覆盖。

5. 要注意的点

除非想设置动态默认时间为项目的启动时间,否则default=datetime.now()这种用法是错误的,会得到期望之外的结果。

使用User.objects.update方法时,设置的default=datetime.now和auto_now=True都不会生效,由于设置了auto_now=True的字段不能手动修改,此时只能使用save方法修改数据,这对于多个数据的更新是不友好的。

因此如果设置动态默认时间的字段,应该使用default=datetime.now和auto_now_add=True来实现。

二、null=True和blank=True的区别

1. null针对数据库,如果null=True,表示数据库的该字段可以为空。

2. blank针对表单的,如果blank=True,表示表单填写该字段时可以不填。

mysql中空值不占用空间,NULL占用空间,而且使用NULL会使索引的效率下降。因此从性能上来说,不建议使用null=True,最好使用default=''。

三、save和build_create的区别

1. 使用save方法:

names = ['张三', '李四']
for name in names:
  user = User(name=name)
  user.save()
  print(user.id) # 此时user对象有id的值

2. 使用bulk_create方法:

names = ['张三', '李四']
users = [User(name=name) for name in names]
users = User.objects.bulk_create(users)
print([user.id for user in users]) # 此时user对象没有id的值

bulk_create的优点:

批量操作时只与数据库进行一次交互,效率高。

bulk_create的缺点:

对于设置了自增的字段,返回值中不会有该字段的值,如上例2中的user对象。

对于设置了动态默认时间的字段,如设置了auto_now=True,同一批处理的记录中该字段的时间将会相同。

四、上面的知识点使用的例子

1. 定义模型

from django.db import models
from datetime import datetime
 
class User(models.Model):
  id = models.BigAutoField('主键', primary_key=True)
  name = models.CharField('名字', max_length=20, db_index=True, blank=False, default='')
  create_time = models.DateTimeField('创建时间', auto_now_add=True)
  update_time = models.DateTimeField('更新时间', default=datetime.now)

2. 插入数据

# 方法一
names = ['张三', '李四']
users = [User(name=name) for name in names]
users = User.objects.bulk_create(users)
 
# 方法二
names = ['张三', '李四']
users = [User(name=name) for name in names]
[user.save() for user in users]

3. 修改数据

# 方法一
names = ['张三', '李四']
User.objects.filter(name__in=names).update(name='changed', update_time=datetime.now()) # 这里必须显式对update_time赋值
 
# 方法二
names = ['张三', '李四']
users = User.objects.filter(name__in=names)
for use in users:
  user.name = 'changed'
  user.save() # 这里会自动更新update_time,但是多次save效率低

以上这篇Django bulk_create()、update()与数据库事务的效率对比分析就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Django中的“惰性翻译”方法的相关使用
Jul 27 Python
numpy添加新的维度:newaxis的方法
Aug 02 Python
python实现向微信用户发送每日一句 python实现微信聊天机器人
Mar 27 Python
Python微信操控itchat的方法
May 31 Python
python视频按帧截取图片工具
Jul 23 Python
Python学习笔记之Break和Continue用法分析
Aug 14 Python
使用Python三角函数公式计算三角形的夹角案例
Apr 15 Python
如何实现在jupyter notebook中播放视频(不停地展示图片)
Apr 23 Python
Python ConfigParser模块的使用示例
Oct 12 Python
matplotlib之pyplot模块坐标轴标签设置使用(xlabel()、ylabel())
Feb 22 Python
python全面解析接口返回数据
Feb 12 Python
Python使用socket去实现TCP客户端和TCP服务端
Apr 12 Python
Python实现aes加密解密多种方法解析
May 15 #Python
django 数据库 get_or_create函数返回值是tuple的问题
May 15 #Python
重写django的model下的objects模型管理器方式
May 15 #Python
Python基于pip实现离线打包过程详解
May 15 #Python
Django在Model保存前记录日志实例
May 14 #Python
django 连接数据库出现1045错误的解决方式
May 14 #Python
Django ORM filter() 的运用详解
May 14 #Python
You might like
表格 隔行换色升级版
2009/11/07 Javascript
js中字符替换函数String.replace()使用技巧
2011/08/14 Javascript
JS子父窗口互相操作取值赋值的方法介绍
2013/05/11 Javascript
禁用Enter键表单自动提交实现代码
2014/05/22 Javascript
node.js路径处理方法以及绝对路径详解
2021/03/04 Javascript
bootstrap table复杂操作代码
2016/11/01 Javascript
jQuery实现简单的抽奖游戏
2017/05/05 jQuery
使用 Javascript 实现浏览器推送提醒功能的示例
2017/11/03 Javascript
js判断文件类型大小并给出提示的实现方法
2018/01/03 Javascript
原生JS实现简单的倒计时功能示例
2018/08/30 Javascript
微信小程序实现卡片左右滑动效果的示例代码
2019/05/01 Javascript
vue自定义表单生成器form-create使用详解
2019/07/19 Javascript
layui-table表复选框勾选的所有行数据获取的例子
2019/09/13 Javascript
微信小程序实现点击图片放大预览
2019/10/21 Javascript
vue 取出v-for循环中的index值实例
2019/11/09 Javascript
webpack 动态批量加载文件的实现方法
2020/03/19 Javascript
Python使用回溯法子集树模板解决爬楼梯问题示例
2017/09/08 Python
python绘制地震散点图
2019/06/18 Python
python实现H2O中的随机森林算法介绍及其项目实战
2019/08/29 Python
python爬虫-模拟微博登录功能
2019/09/12 Python
python实现人工蜂群算法
2020/09/18 Python
美国名牌太阳镜折扣网站:Eyedictive
2017/05/15 全球购物
JYSK加拿大:购买家具、床垫、家居装饰等
2020/02/14 全球购物
农行实习自我鉴定
2013/09/22 职场文书
公司财务工作总结的自我评价
2013/11/23 职场文书
班组长工作职责
2013/12/25 职场文书
个人课题方案
2014/05/08 职场文书
导师工作推荐信范文
2014/05/17 职场文书
淘宝店策划方案
2014/06/07 职场文书
行政管理专业求职信
2014/07/06 职场文书
交通事故委托书范本(2篇)
2014/09/21 职场文书
高一语文教学反思
2016/02/16 职场文书
房屋转让协议书(标准范本)
2016/03/21 职场文书
MySQL基础(一)
2021/04/05 MySQL
Python如何利用正则表达式爬取网页信息及图片
2021/04/17 Python
使用nginx配置访问wgcloud的方法
2021/06/26 Servers