Python控制多进程与多线程并发数总结


Posted in Python onOctober 26, 2016

一、前言

本来写了脚本用于暴力破解密码,可是1秒钟尝试一个密码2220000个密码我的天,想用多线程可是只会一个for全开,难道开2220000个线程吗?只好学习控制线程数了,官方文档不好看,觉得结构不够清晰,网上找很多文章也都不很清晰,只有for全开线程,没有控制线程数的具体说明,最终终于根据多篇文章和官方文档算是搞明白基础的多线程怎么实现法了,怕长时间不用又忘记,找着麻烦就贴这了,跟我一样新手也可以参照参照。

先说进程和线程的区别:

  1. 地址空间:进程内的一个执行单元;进程至少有一个线程;它们共享进程的地址空间;而进程有自己独立的地址空间;
  2. 资源拥有:进程是资源分配和拥有的单位,同一个进程内的线程共享进程的资源
  3. 线程是处理器调度的基本单位,但进程不是.
  4. 二者均可并发执行.

不能理解的话简单打比方就是一个进程就像一个程序一样,并发互不干扰。一个进程靠一个或多个线程执行处理,并发的线程是cpu在不停的来回切换执行,当然是快到你感觉不出的。

拿上面我遇到的困难来说吧,大量的数据需要执行相同的处理,一个操作中间可能会有一些等待时间,一个一个执行浪费大量时间,那么就同时执行吧,我们可以用两种并行办法:

进程并行或者线程并行

各有优缺点,要看情况,不是绝对的,在此不讨论这个,这引出下面两种Python并行处理方法(注释感觉很清晰详细了,不再多说)

二、进程处理方法

#coding:utf-8
import random
from time import sleep
import sys
import multiprocessing
import os
#
#需求分析:有大批量数据需要执行,而且是重复一个函数操作(例如爆破密码),如果全部开始线程数N多,这里控制住线程数m个并行执行,其他等待
#
lock=multiprocessing.Lock()#一个锁
def a(x):#模拟需要重复执行的函数
  lock.acquire()#输出时候上锁,否则进程同时输出时候会混乱,不可读
  print '开始进程:',os.getpid(),'模拟进程时间:',x
  lock.release()
  
  sleep(x)#模拟执行操作
  
  lock.acquire()
  print '结束进程:',os.getpid(),'预测下一个进程启动会使用该进程号'
  lock.release()
list=[]
for i in range(10):#产生一个随机数数组,模拟每次调用函数需要的输入,这里模拟总共有10组需要处理
  list.append(random.randint(1,10))
  
pool=multiprocessing.Pool(processes=3)#限制并行进程数为3
pool.map(a,list)#创建进程池,调用函数a,传入参数为list,此参数必须是一个可迭代对象,因为map是在迭代创建每个进程

输出:

Python控制多进程与多线程并发数总结

三、线程处理方法:

#coding:utf-8
import threading
import random
import Queue
from time import sleep
import sys
#
#需求分析:有大批量数据需要执行,而且是重复一个函数操作(例如爆破密码),如果全部开始线程数N多,这里控制住线程数m个并行执行,其他等待
#
#继承一个Thread类,在run方法中进行需要重复的单个函数操作
class Test(threading.Thread):
  def __init__(self,queue,lock,num):
    #传递一个队列queue和线程锁,并行数
    threading.Thread.__init__(self)
    self.queue=queue
    self.lock=lock
    self.num=num
  def run(self):
    #while True:#不使用threading.Semaphore,直接开始所有线程,程序执行完毕线程都还不死,最后的print threading.enumerate()可以看出
    with self.num:#同时并行指定的线程数量,执行完毕一个则死掉一个线程
      #以下为需要重复的单次函数操作
      n=self.queue.get()#等待队列进入
      lock.acquire()#锁住线程,防止同时输出造成混乱
      print '开始一个线程:',self.name,'模拟的执行时间:',n
      print '队列剩余:',queue.qsize()
      print threading.enumerate()
      lock.release()
      sleep(n)#执行单次操作,这里sleep模拟执行过程
      self.queue.task_done()#发出此队列完成信号
threads=[]
queue=Queue.Queue()
lock=threading.Lock()
num=threading.Semaphore(3)#设置同时执行的线程数为3,其他等待执行
#启动所有线程
for i in range(10):#总共需要执行的次数
  t=Test(queue,lock,num)
  t.start()
  threads.append(t)
  #吧队列传入线程,是run结束等待开始执行,放下面单独一个for也行,这里少个循环吧
  n=random.randint(1,10)
  queue.put(n)#模拟执行函数的逐个不同输入
#吧队列传入线程,是run结束等待开始执行
#for t in threads:
#  n=random.randint(1,10)
#  queue.put(n)
#等待线程执行完毕
for t in threads:
  t.join()
queue.join()#等待队列执行完毕才继续执行,否则下面语句会在线程未接受就开始执行
print '所有执行完毕'
print threading.active_count()
print threading.enumerate()

输出:

Python控制多进程与多线程并发数总结

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
centos下更新Python版本的步骤
Feb 12 Python
使用Python的turtle模块画图的方法
Nov 15 Python
python实现拓扑排序的基本教程
Mar 11 Python
Python 调用PIL库失败的解决方法
Jan 08 Python
python利用Opencv实现人脸识别功能
Apr 25 Python
python3.7通过thrift操作hbase的示例代码
Jan 14 Python
新版Pycharm中Matplotlib不会弹出独立的显示窗口的问题
Jun 02 Python
django Model层常用验证器及自定义验证器详解
Jul 15 Python
Python request中文乱码问题解决方案
Sep 17 Python
python 发送邮件的示例代码(Python2/3都可以直接使用)
Dec 03 Python
Python如何导出导入所有依赖包详解
Jun 08 Python
python周期任务调度工具Schedule使用详解
Nov 23 Python
Python网络爬虫项目:内容提取器的定义
Oct 25 #Python
Python实现ssh批量登录并执行命令
Oct 25 #Python
详解Python的Lambda函数与排序
Oct 25 #Python
Python脚本实现Web漏洞扫描工具
Oct 25 #Python
python+django快速实现文件上传
Oct 24 #Python
python实现简单爬虫功能的示例
Oct 24 #Python
简单谈谈Python中的反转字符串问题
Oct 24 #Python
You might like
让你同时上传 1000 个文件 (二)
2006/10/09 PHP
php下通过伪造http头破解防盗链的代码
2010/07/03 PHP
ThinkPHP实现跨模块调用操作方法概述
2014/06/20 PHP
php倒计时出现-0情况的解决方法
2016/07/28 PHP
yii2中LinkPager增加总页数和总记录数的实例
2017/08/28 PHP
PHP获取对象属性的三种方法实例分析
2019/01/03 PHP
javascript cookie解码函数(兼容ff)
2008/03/17 Javascript
Javascript结合css实现网页换肤功能
2009/11/02 Javascript
基于jsTree的无限级树JSON数据的转换代码
2010/07/27 Javascript
jQuery构造函数init参数分析
2015/05/13 Javascript
在 Express 中使用模板引擎
2015/12/10 Javascript
改变checkbox默认选中状态及取值的实现代码
2016/05/26 Javascript
AngularJS基础 ng-repeat 指令简单示例
2016/08/03 Javascript
ES6正则表达式扩展笔记
2017/07/25 Javascript
详解Angular2表单-模板驱动的表单(Template-Driven Forms)
2017/08/04 Javascript
jQuery基于Ajax实现读取XML数据功能示例
2018/05/31 jQuery
小程序兼容安卓和IOS数据处理问题及坑
2018/09/18 Javascript
javascript实现函数柯里化与反柯里化过程解析
2019/10/08 Javascript
微信小程序实现二维码签到考勤系统
2020/01/16 Javascript
Angular之jwt令牌身份验证的实现
2020/02/14 Javascript
antd中table展开行默认展示,且不需要前边的加号操作
2020/11/02 Javascript
[02:42]DOTA2英雄基础教程 杰奇洛
2013/12/23 DOTA
[01:54]TI珍贵瞬间系列(三):翻盘
2020/08/28 DOTA
python中文编码问题小结
2014/09/28 Python
Python爬虫实现网页信息抓取功能示例【URL与正则模块】
2017/05/18 Python
python 获取一个值在某个区间的指定倍数的值方法
2018/11/12 Python
Python3 使用map()批量的转换数据类型,如str转float的实现
2019/11/29 Python
python爬虫学习笔记之Beautifulsoup模块用法详解
2020/04/09 Python
大专毕业生自我评价分享
2013/11/10 职场文书
测绘专业大学生职业生涯规划书
2014/02/10 职场文书
MySQL 重命名表的操作方法及注意事项
2021/05/21 MySQL
element多个表单校验的实现
2021/05/27 Javascript
Python中文纠错的简单实现
2021/07/07 Python
Python游戏开发实例之graphics实现AI五子棋
2021/11/01 Python
python对文档中元素删除,替换操作
2022/04/02 Python
HTML页面中使两个div并排显示的实现
2022/05/15 HTML / CSS