Django异步任务线程池实现原理


Posted in Python onDecember 17, 2019

这篇文章主要介绍了Django异步任务线程池实现原理,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

当数据库数据量很大时(百万级),许多批量数据修改请求的响应会非常慢,一些不需要即时响应的任务可以放到后台的异步线程中完成,发起异步任务的请求就可以立即响应

选择用线程池的原因是:线程比进程更为可控。不像子进程,子线程会在所属进程结束时立即结束。线程可共享内存。

请求任务异步处理的原理

使用python manage.py runserver模式启动的Django应用只有一个进程,对于每个请求,主线程会开启一个子线程来处理请求。请求子线程向主线程申请一个新线程,然后把耗时的任务交给新线程,自身立即响应,这就是请求任务异步处理的原理。

可视化线程池

如果想要管理这批异步线程,知道他们是否在运行中,可以使用线程池(ThreadPoolExecutor)。

线程池会先启动若干数量的线程,并让这些线程都处于睡眠状态,当向线程池submit一个任务后,会唤醒线程池中的某一个睡眠线程,让它来处理这个任务,当处理完这个任务,线程又处于睡眠状态。

submit任务后会返回一个期程(future),这个对象可以查看线程池中执行此任务的线程是否仍在处理中

因此可以构建一个全局可视化线程池:

from concurrent.futures.thread import ThreadPoolExecutor


class ThreadPool(object):
  def __init__(self):
    # 线程池
    self.executor = ThreadPoolExecutor(20)
    # 用于存储每个项目批量任务的期程
    self.future_dict = {}

  # 检查某个项目是否有正在运行的批量任务
  def is_project_thread_running(self, project_id):
    future = self.future_dict.get(project_id, None)
    if future and future.running():
      # 存在正在运行的批量任务
      return True
    return False

  # 展示所有的异步任务
  def check_future(self):
    data = {}
    for project_id, future in self.future_dict.items():
      data[project_id] = future.running()
    return data

  def __del__(self):
    self.executor.shutdown()

# 主线程中的全局线程池
# global_thread_pool的生命周期是Django主线程运行的生命周期
global_thread_pool = ThreadPool()

使用:

# 检查异步任务
if global_thread_pool.is_project_thread_running(project_id):
  raise exceptions.ValidationError(detail='存在正在处理的批量任务,请稍后重试')

# 提交一个异步任务
future = global_thread_pool.executor.submit(self.batch_thread, project_id)
global_thread_pool.future_dict[project_id] = future

# 查看所有异步任务
@login_required
def check_future(request):
  data = global_thread_pool.check_future()
  return HttpResponse(status=status.HTTP_200_OK, content=json.dumps(data))

串行执行

使用线程锁

在全局线程池中初始化线程锁

class ThreadPool(object):
  def __init__(self):
    self.executor = ThreadPoolExecutor(20)
    self.future_dict = {}
    self.lock = threading.Lock()

然后执行线程前需要获取锁并再执行结束后释放锁

def batch_thread(self):
  global_thread_pool.lock.acquire()
  try:
    ...
    global_thread_pool.lock.release()
  except Exception:
    trace_log = traceback.format_exc()
    logger.error('异步任务执行失败:\n %s' % trace_log)
    global_thread_pool.lock.release()

需要捕捉异常预防子线程出错而无法释放锁的情况

异步线程任务执行前先检查数据库连接是否可用,然后关掉不可用连接

由于django的数据库连接是保存到线程本地变量中的,通过ThreadPoolExecutor创建的线程会保存各自的数据库连接。

当连接被保存的时间超过mysql连接的最大超时时间,连接失效,但不会被线程释放。

之后再调起线程执行涉及到数据库操作的异步任务时,会用到失效的数据库连接,导致报错“MySQL server has gone away”。

解决方案是在线程池的所有异步任务执行前先检查数据库连接是否可用,然后关掉不可用连接

def batch_thread(self):
  for conn in connections.all():
    conn.close_if_unusable_or_obsolete()
  ...

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用 Python 实现微信公众号粉丝迁移流程
Jan 03 Python
Tensorflow 利用tf.contrib.learn建立输入函数的方法
Feb 08 Python
Win8下python3.5.1安装教程
Jul 29 Python
用python3教你任意Html主内容提取功能
Nov 05 Python
python被修饰的函数消失问题解决(基于wraps函数)
Nov 04 Python
Python 将json序列化后的字符串转换成字典(推荐)
Jan 06 Python
Python如何使用OS模块调用cmd
Feb 27 Python
python 中的9个实用技巧,助你提高开发效率
Aug 30 Python
彻底搞懂python 迭代器和生成器
Sep 07 Python
tensorflow与numpy的版本兼容性问题的解决
Jan 08 Python
使用Python开发贪吃蛇游戏 SnakeGame
Apr 30 Python
Python中的 enumerate和zip详情
May 30 Python
python 求10个数的平均数实例
Dec 16 #Python
python 经典数字滤波实例
Dec 16 #Python
Python实现把类当做字典来访问
Dec 16 #Python
python中p-value的实现方式
Dec 16 #Python
基于python读取.mat文件并取出信息
Dec 16 #Python
python基于plotly实现画饼状图代码实例
Dec 16 #Python
python 实现让字典的value 成为列表
Dec 16 #Python
You might like
php在线打包程序源码
2008/07/27 PHP
php 魔术函数使用说明
2010/02/21 PHP
注意:php5.4删除了session_unregister函数
2013/08/05 PHP
PHP版本的选择5.2.17 5.3.27 5.3.28 5.4 5.5兼容性问题分析
2016/04/04 PHP
Joomla使用Apache重写模式的方法
2016/05/04 PHP
php设计模式之单例模式代码
2016/06/11 PHP
php多进程应用场景实例详解
2019/07/22 PHP
JavaScript 类似flash效果的立体图片浏览器
2010/02/08 Javascript
基于jquery的动态创建表格的插件
2011/04/05 Javascript
jquery利用event.which方法获取键盘输入值的代码
2011/10/09 Javascript
js实现回放拖拽轨迹从过程上进行分析
2014/06/26 Javascript
基于jQuery实现多层次的手风琴效果附源码
2015/09/21 Javascript
AngularJS控制器详解及示例代码
2016/08/16 Javascript
通过js修改input、select默认字体颜色
2017/04/19 Javascript
微信{"errcode":48001,"errmsg":"api unauthorized, hints: [ req_id: 1QoCla0699ns81 ]"}
2018/10/12 Javascript
JS监听滚动和id自动定位滚动
2018/12/18 Javascript
JS实现横向轮播图(初级版)
2020/06/24 Javascript
node.js开发辅助工具nodemon安装与配置详解
2020/02/06 Javascript
three.js 实现露珠滴落动画效果的示例代码
2021/03/01 Javascript
Python、Javascript中的闭包比较
2015/02/04 Python
在Python的Django框架中为代码添加注释的方法
2015/07/16 Python
Django学习笔记之Class-Based-View
2017/02/15 Python
Queue 实现生产者消费者模型(实例讲解)
2017/11/13 Python
python如何统计代码运行的时长
2019/07/24 Python
如何利用Python matplotlib绘制雷达图
2020/12/21 Python
css3 中的新特性加强记忆详解
2016/04/16 HTML / CSS
css3旋转木马_动力节点Java学院整理
2017/07/12 HTML / CSS
详解HTML5 data-* 自定义属性
2018/01/24 HTML / CSS
野兽派官方旗舰店:THE BEAST 野兽派
2016/08/05 全球购物
瑞士隐形眼镜和护理产品网上商店:Linsenklick
2019/10/21 全球购物
行政部总经理岗位职责
2014/01/04 职场文书
采购经理岗位职责
2014/02/16 职场文书
幼儿园教研活动总结
2014/04/30 职场文书
2014年党员自我评议对照检查材料
2014/09/20 职场文书
如何判断微信付款码和支付宝付款码
2021/04/01 PHP
Pandas 数据编码的十种方法
2022/04/20 Python