Django异步任务线程池实现原理


Posted in Python onDecember 17, 2019

这篇文章主要介绍了Django异步任务线程池实现原理,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

当数据库数据量很大时(百万级),许多批量数据修改请求的响应会非常慢,一些不需要即时响应的任务可以放到后台的异步线程中完成,发起异步任务的请求就可以立即响应

选择用线程池的原因是:线程比进程更为可控。不像子进程,子线程会在所属进程结束时立即结束。线程可共享内存。

请求任务异步处理的原理

使用python manage.py runserver模式启动的Django应用只有一个进程,对于每个请求,主线程会开启一个子线程来处理请求。请求子线程向主线程申请一个新线程,然后把耗时的任务交给新线程,自身立即响应,这就是请求任务异步处理的原理。

可视化线程池

如果想要管理这批异步线程,知道他们是否在运行中,可以使用线程池(ThreadPoolExecutor)。

线程池会先启动若干数量的线程,并让这些线程都处于睡眠状态,当向线程池submit一个任务后,会唤醒线程池中的某一个睡眠线程,让它来处理这个任务,当处理完这个任务,线程又处于睡眠状态。

submit任务后会返回一个期程(future),这个对象可以查看线程池中执行此任务的线程是否仍在处理中

因此可以构建一个全局可视化线程池:

from concurrent.futures.thread import ThreadPoolExecutor


class ThreadPool(object):
  def __init__(self):
    # 线程池
    self.executor = ThreadPoolExecutor(20)
    # 用于存储每个项目批量任务的期程
    self.future_dict = {}

  # 检查某个项目是否有正在运行的批量任务
  def is_project_thread_running(self, project_id):
    future = self.future_dict.get(project_id, None)
    if future and future.running():
      # 存在正在运行的批量任务
      return True
    return False

  # 展示所有的异步任务
  def check_future(self):
    data = {}
    for project_id, future in self.future_dict.items():
      data[project_id] = future.running()
    return data

  def __del__(self):
    self.executor.shutdown()

# 主线程中的全局线程池
# global_thread_pool的生命周期是Django主线程运行的生命周期
global_thread_pool = ThreadPool()

使用:

# 检查异步任务
if global_thread_pool.is_project_thread_running(project_id):
  raise exceptions.ValidationError(detail='存在正在处理的批量任务,请稍后重试')

# 提交一个异步任务
future = global_thread_pool.executor.submit(self.batch_thread, project_id)
global_thread_pool.future_dict[project_id] = future

# 查看所有异步任务
@login_required
def check_future(request):
  data = global_thread_pool.check_future()
  return HttpResponse(status=status.HTTP_200_OK, content=json.dumps(data))

串行执行

使用线程锁

在全局线程池中初始化线程锁

class ThreadPool(object):
  def __init__(self):
    self.executor = ThreadPoolExecutor(20)
    self.future_dict = {}
    self.lock = threading.Lock()

然后执行线程前需要获取锁并再执行结束后释放锁

def batch_thread(self):
  global_thread_pool.lock.acquire()
  try:
    ...
    global_thread_pool.lock.release()
  except Exception:
    trace_log = traceback.format_exc()
    logger.error('异步任务执行失败:\n %s' % trace_log)
    global_thread_pool.lock.release()

需要捕捉异常预防子线程出错而无法释放锁的情况

异步线程任务执行前先检查数据库连接是否可用,然后关掉不可用连接

由于django的数据库连接是保存到线程本地变量中的,通过ThreadPoolExecutor创建的线程会保存各自的数据库连接。

当连接被保存的时间超过mysql连接的最大超时时间,连接失效,但不会被线程释放。

之后再调起线程执行涉及到数据库操作的异步任务时,会用到失效的数据库连接,导致报错“MySQL server has gone away”。

解决方案是在线程池的所有异步任务执行前先检查数据库连接是否可用,然后关掉不可用连接

def batch_thread(self):
  for conn in connections.all():
    conn.close_if_unusable_or_obsolete()
  ...

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python批量修改文件后缀的方法
Jan 26 Python
Python中关于使用模块的基础知识
May 24 Python
Python 爬虫学习笔记之多线程爬虫
Sep 21 Python
Python使用迭代器捕获Generator返回值的方法
Apr 05 Python
详解Django中间件执行顺序
Jul 16 Python
使用Python处理BAM的方法
Sep 28 Python
Window环境下Scrapy开发环境搭建
Nov 18 Python
python虚拟环境迁移方法
Jan 03 Python
详解Python3 pandas.merge用法
Sep 05 Python
通过实例了解python property属性
Nov 01 Python
python删除某个目录文件夹的方法
May 26 Python
Django项目如何正确配置日志(logging)
Apr 29 Python
python 求10个数的平均数实例
Dec 16 #Python
python 经典数字滤波实例
Dec 16 #Python
Python实现把类当做字典来访问
Dec 16 #Python
python中p-value的实现方式
Dec 16 #Python
基于python读取.mat文件并取出信息
Dec 16 #Python
python基于plotly实现画饼状图代码实例
Dec 16 #Python
python 实现让字典的value 成为列表
Dec 16 #Python
You might like
thinkphp中U方法按路由规则生成url的方法
2018/03/12 PHP
jQuery的运行机制和设计理念分析
2011/04/05 Javascript
自定义的一个简单时尚js下拉选择框
2013/11/20 Javascript
js调试系列 控制台命令行API使用方法
2014/06/18 Javascript
javascript基础语法学习笔记
2016/01/04 Javascript
JavaScript中三种异步上传文件方式
2016/03/06 Javascript
javascript拖拽应用实例
2016/03/25 Javascript
JavaScript 基础函数_深入剖析变量和作用域
2016/05/18 Javascript
JS正则表达式判断有效数实例代码
2017/03/13 Javascript
vue实现消息的无缝滚动效果的示例代码
2017/12/05 Javascript
vue弹出框组件封装实例代码
2019/10/31 Javascript
详解vue页面首次加载缓慢原因及解决方案
2019/11/06 Javascript
python实现无证书加密解密实例
2014/10/27 Python
Python实现读取文件最后n行的方法
2017/02/23 Python
解决python中无法自动补全代码的问题
2018/12/04 Python
Python基于datetime或time模块分别获取当前时间戳的方法实例
2019/02/19 Python
Python爬取智联招聘数据分析师岗位相关信息的方法
2019/08/13 Python
Python使用get_text()方法从大段html中提取文本的实例
2019/08/27 Python
python 比较2张图片的相似度的方法示例
2019/12/18 Python
Django后端分离 使用element-ui文件上传方式
2020/07/12 Python
Python 必须了解的5种高级特征
2020/09/10 Python
python 实现Requests发送带cookies的请求
2021/02/08 Python
CSS3美化表单控件全集
2016/06/29 HTML / CSS
免税水晶:Duty Free Crystal
2019/05/13 全球购物
标记环介质访问控制协议
2016/03/27 面试题
应聘医学检验人员自荐信
2013/09/27 职场文书
工程造价专业大专生求职信
2013/10/06 职场文书
大学四年规划书范文
2013/12/27 职场文书
《那片绿绿的爬山虎》教学反思
2014/02/27 职场文书
授权委托书样本
2014/04/03 职场文书
行风评议整改报告
2014/11/06 职场文书
2015共产党员公开承诺书
2015/01/22 职场文书
幼儿园教师自荐书
2015/03/06 职场文书
Python 详解通过Scrapy框架实现爬取CSDN全站热榜标题热词流程
2021/11/11 Python
Windows11性能真的上涨35%? 桌面酷睿i9实测结果公开
2021/11/21 数码科技
WIN10使用IIS部署ftp服务器详细教程
2022/08/05 Servers