用Python实现一个简单的线程池


Posted in Python onApril 07, 2015

线程池的概念是什么?

在面向对象编程中,创建和销毁对象是很费时间的,因为创建一个对象要获取内存资源或者其它更多资源。在Java中更是 如此,虚拟机将试图跟踪每一个对象,以便能够在对象销毁后进行垃圾回收。所以提高服务程序效率的一个手段就是尽可能减少创建和销毁对象的次数,特别是一些 很耗资源的对象创建和销毁。如何利用已有对象来服务就是一个需要解决的关键问题,其实这就是一些"池化资源"技术产生的原因。

我理解为线程池是一个存放很多线程的单位,同时还有一个对应的任务队列。整个执行过程其实就是使用线程池中已有有限的线程把任务 队列中的任务做完。这样做的好处就是你不需要为每个任务都创建一个线程,因为当你创建第100个线程来执行第100个任务的时候,可能前面已经有50个线 程结束工作了。因此重复利用线程来执行任务,减少系统资源的开销。

一个不怎么恰当的比喻就是,有100台电脑主机箱需要从1楼搬到2楼,你不需要喊来100人帮忙搬,你只需要叫十个或者二十个人就足以,每个人分配十个或者五个甚至是谁搬的快谁就多搬知道完成未知。(这个比喻好像。。。。。)

不管如何吧,大体上理解了线程池的概念。那么怎么用python实现呢?

代码如下
 

# !/usr/bin/env python
# -*- coding:utf-8 -*-
# ref_blog:http://www.open-open.com/home/space-5679-do-blog-id-3247.html
import Queue
import threading
import time
class WorkManager(object):
  def __init__(self, work_num=1000,thread_num=2):
    self.work_queue = Queue.Queue()
    self.threads = []
    self.__init_work_queue(work_num)
    self.__init_thread_pool(thread_num)
  """
    初始化线程
  """
  def __init_thread_pool(self,thread_num):
    for i in range(thread_num):
      self.threads.append(Work(self.work_queue))
  """
    初始化工作队列
  """
  def __init_work_queue(self, jobs_num):
    for i in range(jobs_num):
      self.add_job(do_job, i)
  """
    添加一项工作入队
  """
  def add_job(self, func, *args):
    self.work_queue.put((func, list(args)))#任务入队,Queue内部实现了同步机制
  """
    检查剩余队列任务
  """
  def check_queue(self):
    return self.work_queue.qsize()
  """
    等待所有线程运行完毕
  """ 
  def wait_allcomplete(self):
    for item in self.threads:
      if item.isAlive():item.join()
class Work(threading.Thread):
  def __init__(self, work_queue):
    threading.Thread.__init__(self)
    self.work_queue = work_queue
    self.start()
  def run(self):
    #死循环,从而让创建的线程在一定条件下关闭退出
    while True:
      try:
        do, args = self.work_queue.get(block=False)#任务异步出队,Queue内部实现了同步机制
        do(args)
        self.work_queue.task_done()#通知系统任务完成
      except Exception,e:
        print str(e)
        break
#具体要做的任务
def do_job(args):
  print args
  time.sleep(0.1)#模拟处理时间
  print threading.current_thread(), list(args)
if __name__ == '__main__':
  start = time.time()
  work_manager = WorkManager(10, 2)#或者work_manager = WorkManager(10000, 20)
  work_manager.wait_allcomplete()
  end = time.time()
  print "cost all time: %s" % (end-start)

这个代码清晰易懂。

整个代码只有两个类:WorkManager和Work,前者确实如命名所示,是一个管理者,管理线程池和任务队列,而后者就是具体的一个线程。

它的整个运行逻辑就是,给WorkManager分配制定的任务量和线程数,然后每个线程都从任务队列中获取任务来执行,直到队列中没有任务。这里面也用到了Queue内部的同步机制(至于是啥同步机制目前还没去研究)。

总结一下这样一个线程池的作用,对于我本来的目的其实这个东西是永不上的,因为我需要在web页面来控制线程的启动和停止,而这个线程池看起来只是用来并发完任务的。不过我想虽然在控制线程方面没有作用,但是它的并发执行任务的作用还是蛮不错,或许可以用在爬网页的部分。

Python 相关文章推荐
Python性能优化技巧
Mar 09 Python
使用Python3 编写简单信用卡管理程序
Dec 21 Python
python实现人脸识别代码
Nov 08 Python
Python实现元素等待代码实例
Nov 11 Python
在Python中等距取出一个数组其中n个数的实现方式
Nov 27 Python
使用Python打造一款间谍程序的流程分析
Feb 21 Python
Python使用进程Process模块管理资源
Mar 05 Python
Python HTMLTestRunner测试报告view按钮失效解决方案
May 25 Python
Pycharm2020.1安装无法启动问题即设置中文插件的方法
Aug 07 Python
python如何构建mock接口服务
Jan 28 Python
Python爬虫基础讲解之请求
May 13 Python
Python超详细分步解析随机漫步
Mar 17 Python
浅谈Python程序与C++程序的联合使用
Apr 07 #Python
浅要分析Python程序与C程序的结合使用
Apr 07 #Python
python实现根据用户输入从电影网站获取影片信息的方法
Apr 07 #Python
python中列表元素连接方法join用法实例
Apr 07 #Python
简单介绍Python中的filter和lambda函数的使用
Apr 07 #Python
解析Python中的变量、引用、拷贝和作用域的问题
Apr 07 #Python
在Python中利用Pandas库处理大数据的简单介绍
Apr 07 #Python
You might like
web站点获取用户IP的安全方法 HTTP_X_FORWARDED_FOR检验
2013/06/01 PHP
PHP 通过Socket收发十六进制数据的实现代码
2013/08/16 PHP
PHP入门教程之自定义函数用法详解(创建,调用,变量,参数,返回值等)
2016/09/11 PHP
谈谈从phpinfo中能获取哪些值得注意的信息
2017/03/28 PHP
laravel实现查询最后执行的一条sql语句的方法
2019/10/09 PHP
Javascript学习笔记之函数篇(五) : 构造函数
2014/11/23 Javascript
基于Bootstrap的后台管理面板 Bootstrap Metro Dashboard
2016/06/17 Javascript
js实现简单的碰壁反弹效果
2016/08/30 Javascript
JS遍历ul下的li点击弹出li的索引的实现方法
2016/09/19 Javascript
第一次接触神奇的Bootstrap
2016/10/14 Javascript
js仿淘宝商品放大预览功能
2017/03/15 Javascript
[04:28]DOTA2亚洲邀请赛小组赛第五日 TOP10精彩集锦
2015/02/03 DOTA
Python 命令行参数sys.argv
2008/09/06 Python
python实现简单的socket server实例
2015/04/29 Python
Django的URLconf中使用缺省视图参数的方法
2015/07/18 Python
python微信跳一跳系列之色块轮廓定位棋盘
2018/02/26 Python
Python实现模拟登录网易邮箱的方法示例
2018/07/05 Python
Django中提供的6种缓存方式详解
2019/08/05 Python
Python 面向对象之封装、继承、多态操作实例分析
2019/11/21 Python
Tensorflow的梯度异步更新示例
2020/01/23 Python
python的launcher用法知识点总结
2020/08/07 Python
移动端Html5页面生成图片解决方案
2018/08/07 HTML / CSS
Myholidays美国:在线旅游网站
2019/08/16 全球购物
英国运动服、设备及配件网站:DW Sports
2019/12/04 全球购物
杭州联环马网络笔试题面试题
2013/08/04 面试题
.NET面试题:什么是反射
2016/09/30 面试题
如何在Shell脚本中使用函数
2015/09/06 面试题
母亲节演讲稿范文
2014/01/02 职场文书
主题教育活动总结
2014/05/05 职场文书
团代会宣传工作方案
2014/05/08 职场文书
民主生活会批评与自我批评总结
2014/10/17 职场文书
2014年团支部工作总结
2014/11/17 职场文书
小学生光盘行动倡议书
2015/04/28 职场文书
作文之亲情600字
2019/09/23 职场文书
十个Python自动化常用操作,即拿即用
2021/05/10 Python
Python绘制散点图之可视化神器pyecharts
2022/07/07 Python