Python多线程的退出控制实现


Posted in Python onAugust 10, 2020

日常前言

最近接 到一个抢票的爬虫外包,那个网站及其之捞,访问购票地址竟然还要排队,在购票高峰临时升一下服务器配置不行吗…没办法,甲方爸爸的要求还得做啊,其中一个障碍便是目标网站的后端限制了访问频次,俗话说:“上有政策,下有对策。” 立刻想到了多线程 + 多代理的方式进行访问。

Python多线程的退出控制实现

但此时问题便来了,多代理还好说,再写个爬虫爬一堆下来就好,多线程可就麻烦多了,多线程一旦发出去了,基本等同于失控的状态,你无法去结束或者是重启一个线程,最多只能是获取线程的信息,没有实际的控制权,而且Python官方也没有提供相应的结束函数。那么接下来,让我们来好好聊聊解决这个问题的思路。

单线程的结束

说实话,会百度在程序世界是一个优秀的习惯,不然怎么会有这么一张表情包呢

Python多线程的退出控制实现

但是百度这一次却不尽人意,搜了很久,结果不尽人意,基本上所有的搜索结果都告诉我只有结束单个线程的方法,我也试过循环使用百度的结束函数,但最终都只能是结束的当前的这一个线程,无法达到目标。

贴一段搜到的单线程结束代码示例

def _async_raise(tid, exctype):
 tid = ctypes.c_long(tid)
 if not inspect.isclass(exctype):
  exctype = type(exctype)
 res = ctypes.pythonapi.PyThreadState_SetAsyncExc(tid, ctypes.py_object(exctype))
 if res == 0:
  raise ValueError("invalid thread id")
 elif res != 1:
  ctypes.pythonapi.PyThreadState_SetAsyncExc(tid, None)
  raise SystemError("PyThreadState_SetAsyncExc failed")
  
def stop_thread(thread):
 _async_raise(thread.ident, SystemExit)

那怎么结束多个线程呢?

既然度娘也搜不到,那就自己探索,打开python threading模块的官方文档,其中一个daemon属性进入了视野,单词翻译过来便是守护进程,相信大家应该或多或少的听到过,以下是官方的释义,大概意思就是只要在启动线程之前设置了这个属性为True,当父进程结束时,所有的子进程跟着全部结束,这样就好办了,接下来看看代码部分。

daemon
A boolean value indicating whether this thread is a daemon thread (True) or not (False). This must be set before start() is called, otherwise RuntimeError is raised. Its initial value is inherited from the creating thread; the main thread is not a daemon thread and therefore all threads created in the main thread default to daemon = False.

完整代码

import threading,time,random

class Messy:
 def __init__(self):
  self.__messy = 0

 def m(self,i):
		# 随机时间进行打印
  time.sleep(random.random()*2)
  print(i)
  if i == 1:
   self.__messy = 1

 def main(self):
  Threads = []
  # 将会启动10个线程,线程id为 1 时全部线程终止!
  for i in range(10):
   t = threading.Thread(target=self.m,args=(i,))
   t.daemon = 1
   Threads.append(t)
  # 启动所有线程
  for i in Threads:
   i.start()
  # 当标志位【 messy 】时所有多线程结束
  while 1:
   if self.__messy:
    break
  print('线程已退出!')

Messy().main()
# 继续执行后续程序
for i in range(5):
 print('yeah!')

此时,main这个函数对于多线程来讲,便是父进程,也就是守护进程。预计会进行10次循环的数字打印,但是当self.__messy这个标志位为真时,所有的剩余子线程将不会再执行,直接结束进行后续的操作

e.g:如下图便只打印了四次

Python多线程的退出控制实现

最后

目前来讲,用设置主线程退出的方法是可以完成现在这个抢票的目标。

但是后来发现其实这么做也会带来很多坏处,直接杀掉所有子线程对系统来说是一个很粗鲁的行为,如果涉及到的操作包括了文件数据、数据库数据的改动的话,内存无法被合理释放(之前就遇到过CPU莫名占用满),极有可能造成数据丢失甚至系统中断

我这里只是一个抢票的小程序,子线程只用到了POST,网络请求中断带来的影响还是相对来讲比较小的,所以大家酌情使用本篇所介绍的方法。

本文作者: Messy
原文链接:https://www.messys.top/detail/78

到此这篇关于Python多线程的退出控制实现的文章就介绍到这了,更多相关Python多线程退出控制内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python多线程编程方式分析示例详解
Dec 06 Python
Python遍历zip文件输出名称时出现乱码问题的解决方法
Apr 08 Python
利用Python为iOS10生成图标和截屏
Sep 24 Python
python如何重载模块实例解析
Jan 25 Python
python leetcode 字符串相乘实例详解
Sep 03 Python
python 直接赋值和copy的区别详解
Aug 07 Python
python用类实现文章敏感词的过滤方法示例
Oct 27 Python
python爬取王者荣耀全皮肤的简单实现代码
Jan 31 Python
解决jupyter notebook显示不全出现框框或者乱码问题
Apr 09 Python
Python如何把Spark数据写入ElasticSearch
Apr 18 Python
keras读取训练好的模型参数并把参数赋值给其它模型详解
Jun 15 Python
Python图像处理二值化方法实例汇总
Jul 24 Python
Python进行统计建模
Aug 10 #Python
Python如何爬取b站热门视频并导入Excel
Aug 10 #Python
拿来就用!Python批量合并PDF的示例代码
Aug 10 #Python
Python 发送邮件方法总结
Aug 10 #Python
Python getattr()函数使用方法代码实例
Aug 10 #Python
Python matplotlib模块及柱状图用法解析
Aug 10 #Python
Python如何操作docker redis过程解析
Aug 10 #Python
You might like
封装ThinkPHP的一个文件上传方法实例
2014/10/31 PHP
PHP面向对象详解(三)
2015/12/07 PHP
PHP Imagick完美实现图片裁切、生成缩略图、添加水印
2016/02/22 PHP
PHP调用存储过程返回值不一致问题的解决方法分析
2016/04/26 PHP
header与缓冲区之间的深层次分析
2016/07/30 PHP
php7 安装yar 生成docker镜像
2017/05/09 PHP
javascript mouseover、mouseout停止事件冒泡的解决方案
2009/04/07 Javascript
jQuery EasyUI中对表格进行编辑的实现代码
2010/06/10 Javascript
理解Javascript_12_执行模型浅析
2010/10/18 Javascript
Jquery 数据选择插件Pickerbox使用介绍
2012/08/24 Javascript
Javascript中3个需要注意的运算符
2015/04/02 Javascript
javascript实现日期按月份加减
2015/05/15 Javascript
学习AngularJs:Directive指令用法(完整版)
2016/04/26 Javascript
AngularJS过滤器filter用法总结
2016/12/13 Javascript
javascript实现用户点击数量统计
2016/12/25 Javascript
angularJs使用$watch和$filter过滤器制作搜索筛选实例
2017/06/01 Javascript
Vue 子组件与数据传递问题及注意事项
2019/07/11 Javascript
layui实现下拉复选功能的例子(包括数据的回显与上传)
2019/09/24 Javascript
JavaScript switch语句使用方法简介
2019/12/30 Javascript
Vue之封装公用变量以及实现方式
2020/07/31 Javascript
Python标准库之Sys模块使用详解
2015/05/23 Python
详解python的数字类型变量与其方法
2016/11/20 Python
Python中类型检查的详细介绍
2017/02/13 Python
Python 获得命令行参数的方法(推荐)
2018/01/24 Python
将pandas.dataframe的数据写入到文件中的方法
2018/12/07 Python
Python字符串中添加、插入特定字符的方法
2019/09/10 Python
Python二次规划和线性规划使用实例
2019/12/09 Python
Python PIL库图片灰化处理
2020/04/07 Python
瑞贝卡·明可弗包包官网:Rebecca Minkoff
2016/07/21 全球购物
临床医学专业学生的自我评价分享
2013/11/21 职场文书
爱岗敬业演讲稿范文
2014/01/14 职场文书
揭牌仪式主持词
2014/03/19 职场文书
《生命的药方》教学反思
2014/04/08 职场文书
淘宝好评语句大全
2014/12/31 职场文书
朋友离别感言
2015/08/04 职场文书
SpringCloud Function SpEL注入漏洞分析及环境搭建
2022/04/08 Java/Android