解决python线程卡死的问题


Posted in Python onFebruary 18, 2019

1. top命令和日志方式判定卡死的位置

python代码忽然卡死,日志不输出,通过如下方式可以确定线程确实已经死掉了:

# top 命令

top命令可以看到机器上所有线程的执行情况,%CPU和%MEM可以看出线程消耗的资源情况

由于机器上线程数量太多,可能要查看的线程的信息在top命令当前屏幕上显示不出来可以通过如下方式查看

在top命令下输入:u

接下来会提示输入用户名,就可以查看该用户所执行的所有线程

Which user (blank for all): denglinjie

这样就可以看到degnlinjie用户的所有线程

可以看到那几个卡死线程的%CPU和%MEM都为0,说明线程根本没有消耗资源,那么可以看出线程已经卡死了

接下来通过打日志的方式来确定线程究竟是卡死在哪里了,线程卡死的地方大多数都是在io或者http请求那,所以以后遇到线程卡死的情况,就通过打日志的方式来确定卡死的位置,最终定位到问题确实是一个http服务挂掉了,而且此时requests.get()我虽然设置了超时,但是竟然无效

2 . 服务进程数量不足导致的客户端进程卡死

服务端代码:

handler = SimilarityService()
transport = TSocket.TServerSocket('10.134.113.75', 1234)
factory = TBinaryProtocol.TBinaryProtocolFactory()
processor = Processor(handler)
server = TProcessPoolServer.TProcessPoolServer(processor, transport)
server.setNumWorkers(10)
server.serve()

客户端代码

docQue = queues.Queue(maxsize=1000)
pCount = 15
 
 
class ParseSaveEsProcess(multiprocessing.Process):
 
  def __init__(self, threadId):
    self.threadId = threadId
    multiprocessing.Process.__init__(self)
 
  def run(self):
    global docQue
    f = open('recall_match_file_all_simi.lst.%s' % self.threadId, 'w')
    try:
      transport = TSocket.TSocket('10.134.113.75', 1234)
      transport = TTransport.TBufferedTransport(transport)
      protocol = TBinaryProtocol.TBinaryProtocol(transport)
      client = Client(protocol)
      transport.open()
 
      while True:
        line = docQue.get(block=True)
        if not line:
          print 'thread%d run over' % self.threadId  
          break
 
        p = line.split('\t')
        if len(p) >= 6 and p[5] == 'simi_high':
          simi_str = client.calculate_similarity_by_itemurl(p[0])
          f.write(line + '\t' + simi_str + '\n')
        else:
          f.write(line + '\n')  
      transport.close()
    except Thrift.TException as e:
      print str(e)
      pass  
 
class PutUrlProcess(multiprocessing.Process):
 
  def __init__(self):
    multiprocessing.Process.__init__(self)
 
  def run(self):
    global docQue
    for line in open('recall_match_file.lst', 'r'):
      baikeid = line.strip()
      docQue.put(baikeid, block=True)
 
    for i in range(pCount):
      docQue.put(None, block=True)
 
 
if __name__ == '__main__':
  putProcess = PutUrlProcess()
  putProcess.start()
 
  for i in range(pCount):
    parseProcess = ParseSaveEsProcess(i)
    parseProcess.start()

可以看到,进程ParseSaveEsProcess进程总共开启了15个,每个进程会打开一个thrift连接,打开后一直发送请求,并将处理的结果写文件,全部执行完成后才关闭thrift连接。

可是,发现从启动到执行了很长时间后,只有10个文件里面有内容写入,其中5个一直没有写入:

111965 recall_match_file_all_simi.lst.0
  111878 recall_match_file_all_simi.lst.1
    0 recall_match_file_all_simi.lst.10
    0 recall_match_file_all_simi.lst.11
    0 recall_match_file_all_simi.lst.12
    0 recall_match_file_all_simi.lst.13
    0 recall_match_file_all_simi.lst.14
  113429 recall_match_file_all_simi.lst.2
  110720 recall_match_file_all_simi.lst.3
  111993 recall_match_file_all_simi.lst.4
  113691 recall_match_file_all_simi.lst.5
  113360 recall_match_file_all_simi.lst.6
  113953 recall_match_file_all_simi.lst.7
  112007 recall_match_file_all_simi.lst.8
  113818 recall_match_file_all_simi.lst.9

原因是因为thrift服务端只启动了10个服务进程,所以只能同时处理10个请求,而我客户端打开的thrift连接一直没有关闭,所以10个服务进程被10个客户端连接霸占了,另外5个进程获取不到连接,自然就一直卡住了。

以上这篇解决python线程卡死的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
讲解Python中for循环下的索引变量的作用域
Apr 15 Python
Python实现把回车符\r\n转换成\n
Apr 23 Python
python自动翻译实现方法
May 28 Python
python中模块查找的原理与方法详解
Aug 11 Python
django 多数据库配置教程
May 30 Python
python实现周期方波信号频谱图
Jul 21 Python
django利用request id便于定位及给日志加上request_id
Aug 26 Python
python3中利用filter函数输出小于某个数的所有回文数实例
Nov 24 Python
python之pymysql模块简单应用示例代码
Dec 16 Python
Python可变对象与不可变对象原理解析
Feb 25 Python
Python如何实现后端自定义认证并实现多条件登陆
Jun 22 Python
python使用smtplib模块发送邮件
Dec 17 Python
Python中时间datetime的处理与转换用法总结
Feb 18 #Python
对python中的try、except、finally 执行顺序详解
Feb 18 #Python
python调用matlab的m自定义函数方法
Feb 18 #Python
在Python文件中指定Python解释器的方法
Feb 18 #Python
Python字符串逆序的实现方法【一题多解】
Feb 18 #Python
浅谈pyqt5中信号与槽的认识
Feb 17 #Python
Laravel+Dingo/Api 自定义响应的实现
Feb 17 #Python
You might like
php遍历所有文件及文件夹的方法深入解析
2013/06/08 PHP
浅析关于PHP位运算的简单权限设计
2013/06/30 PHP
CI框架自动加载session出现报错的解决办法
2014/06/17 PHP
PHP JSON出错:Cannot use object of type stdClass as array解决方法
2014/08/16 PHP
PDO::commit讲解
2019/01/27 PHP
Javascript 匿名函数及其代码模式原理
2010/03/19 Javascript
jquery+php随机生成红包金额数量代码分享
2015/08/27 Javascript
初步了解javascript面向对象
2015/11/09 Javascript
模拟javascript中的sort排序(简单实例)
2016/08/17 Javascript
分享19个JavaScript 有用的简写写法
2017/07/07 Javascript
jQuery选取所有复选框被选中的值并用Ajax异步提交数据的实例
2017/08/04 jQuery
React应用中使用Bootstrap的方法
2017/08/15 Javascript
AngularJS中scope的绑定策略实例分析
2017/10/30 Javascript
vue2.0 datepicker使用方法
2018/02/04 Javascript
JavaScript JSON数据处理全集(小结)
2019/08/15 Javascript
Nuxt配置Element-UI按需引入的操作方法
2020/07/06 Javascript
[00:36]DOTA2上海特级锦标赛 Archon战队宣传片
2016/03/04 DOTA
[49:15]DOTA2-DPC中国联赛 正赛 CDEC vs XG BO3 第二场 1月19日
2021/03/11 DOTA
Python的函数嵌套的使用方法
2014/01/24 Python
使用python实现tcp自动重连
2017/07/02 Python
Python编程实现及时获取新邮件的方法示例
2017/08/10 Python
利用TensorFlow训练简单的二分类神经网络模型的方法
2018/03/05 Python
python抓取网站的图片并下载到本地的方法
2018/05/22 Python
Python分割训练集和测试集的方法示例
2019/09/19 Python
浅析python标准库中的glob
2020/03/13 Python
Expedia韩国官网:亚洲发展最快的在线旅游门户网站
2018/02/26 全球购物
什么是符号链接,什么是硬链接?符号链接与硬链接的区别是什么?
2013/05/03 面试题
明信片寄语大全
2014/04/08 职场文书
文明之星事迹材料
2014/05/09 职场文书
干部鉴定材料
2014/05/18 职场文书
学校地质灾害防治方案
2014/06/10 职场文书
收款委托书
2014/10/14 职场文书
教师考核表个人总结
2015/02/12 职场文书
勤俭节约倡议书范文
2015/04/29 职场文书
详解 TypeScript 枚举类型
2021/11/02 Javascript
SpringBoot前端后端分离之Nginx服务器下载安装过程
2022/08/14 Servers