编程 Python

Tornado 多进程实现分析详解

Posted in Python onJanuary 12, 2018

引子

Tornado 是一个网络异步的的web开发框架, 并且可以利用多进程进行提高效率, 下面是创建一个多进程 tornado 程序的例子.

#!/usr/bin/env python
# -*- coding:utf-8 -*-
import os
import time

import tornado.web
import tornado.httpserver
import tornado.ioloop
import tornado.netutil
import tornado.process


class LongHandler(tornado.web.RequestHandler):

	def get(self):
		self.write(str(os.getpid()))
		time.sleep(10)


if __name__ == "__main__":
	app = tornado.web.Application(([r'/', LongHandler], ))
	sockets = tornado.netutil.bind_sockets(8090)
	tornado.process.fork_processes(2)
	server = tornado.httpserver.HTTPServer(app)
	server.add_sockets(sockets)
	tornado.ioloop.IOLoop.instance().start()

上面代码使用 tornado.process.fork_processes 创建了2个子进程, 同时用时访问这个服务两次, 分别会返回两个相邻的pid. 可以看到 tornado 确实使用了两个进程来同时完成任务.

我一直很好奇 tornado 是如何将请求调度到子进程, 多个子进程又如何不同时处理一个请求呢?

探究

我们首先是调用 tornado.netutil.bind_sockets 来创建一个 socket(或一个 socket 列表),

接着我们调用 tornado.process.fork_processes 来 fork 子进程, 阅读此函数的代码会发现这个函数仅仅是创建子进程, 然后主进程负责等待子进程, 如果子进程退出则会根据条件重启子进程, 如果子进程全部退出并不符合重启条件,则主进程退出.

调用这个函数之后, 子进程中函数会返回, 子进程则继续执行调用这个函数之后的代码.

我们在 fork 子进程后做了如下操作.

server = tornado.httpserver.HTTPServer(app)
  server.add_sockets(sockets)
  tornado.ioloop.IOLoop.instance().start()

我们先看看 tornado.httpserver.HTTPServer.add_sockets 发现 HTTPServer是继承的 tornado.netutil.TCPServer , add_sockets 也是实现在 TCPServer 中

tornado.netutil.TCPServer.add_sockets

def add_sockets(self, sockets):
		if self.io_loop is None:
			self.io_loop = IOLoop.instance()

		for sock in sockets:
			self._sockets[sock.fileno()] = sock
			add_accept_handler(sock, self._handle_connection,
							  io_loop=self.io_loop)

主要是映射了下 socket 和 socket 对应的文件描述符, 我们看看它调用的 add_accept_handler

def add_accept_handler(sock, callback, io_loop=None):
	if io_loop is None:
		io_loop = IOLoop.instance()

	def accept_handler(fd, events):
		while True:
			try:
				connection, address = sock.accept()
			except socket.error as e:
				if e.args[0] in (errno.EWOULDBLOCK, errno.EAGAIN):
					return
				raise
			callback(connection, address)
	io_loop.add_handler(sock.fileno(), accept_handler, IOLoop.READ)

我们知道 I/O多路复用在处理服务端 socket 时, 当有连接请求过来时, 会触发可读的事件, 此函数将 socket 在主事件循环中注册读事件(IOLoop.READ), 它的回调会创建连接, 我注意到回调里的异常捕获有这样几行

if e.args[0] in (errno.EWOULDBLOCK, errno.EAGAIN):
          return
        raise

发现在创建连接的时候会跳过这个异常呢, 为什么?那么 EWOULDBLOCK 和 EAGAIN是是什么呢? 通过查找知道它的意思是在非阻塞模式下, 不需要重读或重写, EAGAIN 是 EWOULDBLOCK 在 Windows 上的名字, 所以看到这里就很明确了.

结论

Tornado 多进程的处理流程是先创建 socket, 然后再 fork 子进程, 这样所有的子进程实际都监听一个(或多个)文件描述符, 也就是都在监听同样的 socket.

当连接过来所有的子进程都会收到可读事件, 这时候所有的子进程都会跳到 accept_handler 回调函数, 尝试建立连接.

一旦其中一个子进程成功的建立了连接, 当其他子进程再尝试建立这个连接的时候就会触发 EWOULDBLOCK (或 EAGAIN) 错误. 这时候回调函数判断是这个错误则返回函数不做处理.

当成功建立连接的子进程还在处理这个连接的时候又过来一个连接, 这时候就会有另外一个子进程接手这个连接.

Tornado 就是通过这样一种机制, 利用多进程提升效率, 由于连接只能由一个子进程成功创建, 同一个请求也就不会被多个子进程处理.

后记

写完才发现, 我所使用的代码是 tornado-2.4.post2 版本, 当前最新代码是 3.3.0, 查看了下最新代码, 最新代码 TCPServer 写到单独 tornado.tcpserver 里了, 其他和本文相关的并没有什么大的变化.

Category:PythonTagged:Pythonfork_processestornado多进程web提升效率

以上就是本文关于Tornado 多进程实现分析详解的全部内容，希望对大家有所帮助。感兴趣的朋友可以继续参阅本站其他相关专题，如有不足之处，欢迎留言指出。感谢朋友们对本站的支持！

Tornado 多进程实现分析详解

- Author -

mingz2013

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python冒泡排序简单实现方法

Jul 09 Python

Jupyter notebook远程访问服务器的方法

May 24 Python

解决Mac安装scrapy失败的问题

Jun 13 Python

对numpy.append()里的axis的用法详解

Jun 28 Python

python 使用值来排序一个字典的方法

Nov 16 Python

Python利用lxml模块爬取豆瓣读书排行榜的方法与分析

Apr 15 Python

Python3 实现文件批量重命名示例代码

Jun 03 Python

python安装requests库的实例代码

Jun 25 Python

Pytorch Tensor的索引与切片例子

Aug 18 Python

Python统计分析模块statistics用法示例

Sep 06 Python

tensorflow实现残差网络方式(mnist数据集)

May 26 Python

python日志通过不同的等级打印不同的颜色(示例代码)

Jan 13 Python

快速了解Python相对导入

Jan 12 #Python

Python实现翻转数组功能示例

Jan 12 #Python

Python实现求数列和的方法示例

Jan 12 #Python

python+matplotlib演示电偶极子实例代码

Jan 12 #Python

Python实现读取及写入csv文件的方法示例

Jan 12 #Python

python+matplotlib绘制旋转椭圆实例代码

Jan 12 #Python

使用C++扩展Python的功能详解

Jan 12 #Python

You might like

编写安全 PHP应用程序的七个习惯深入分析

2013/06/08 PHP

php生成图片验证码的方法

2016/04/15 PHP

浅谈php使用curl模拟多线程发送请求

2019/03/08 PHP

EasyUI 中 MenuButton 的使用方法

2012/07/14 Javascript

基于jquery自定义图片热区效果

2012/07/21 Javascript

JS实现简单的Canvas画图实例

2013/07/04 Javascript

javascript与jquery中跳出循环的区别总结

2013/11/04 Javascript

JS批量操作CSS属性详细解析

2013/12/16 Javascript

SeaJS入门教程系列之完整示例（三）

2014/03/03 Javascript

JQuery的ON()方法支持的所有事件罗列

2015/02/28 Javascript

JavaScript实现横向滑出的多级菜单效果

2015/10/09 Javascript

jquery mobile 移动web(5)

2015/12/20 Javascript

js实现导航跟随效果

2018/11/17 Javascript

JQuery中queue方法用法示例

2019/01/31 jQuery

JavaScript ES6常用基础知识总结

2019/02/09 Javascript

js实现数据导出为EXCEL（支持大量数据导出）

2020/03/31 Javascript

Vue this.$router.push(参数)实现页面跳转操作

2020/09/09 Javascript

在Python中使用判断语句和循环的教程

2015/04/25 Python

Python自动调用IE打开某个网站的方法

2015/06/03 Python

python判断字符串是否是json格式方法分享

2017/11/07 Python

详解pandas如何去掉、过滤数据集中的某些值或者某些行？

2019/05/15 Python

python 视频逐帧保存为图片的完整实例

2019/12/10 Python

Python3 实现爬取网站下所有URL方式

2020/01/16 Python

什么是python的必选参数

2020/06/21 Python

python+selenium 简易地疫情信息自动打卡签到功能的实现代码

2020/08/22 Python

三只松鼠官方旗舰店：全网坚果销售第1

2017/11/25 全球购物

应届生服务员求职信

2013/10/31 职场文书

培训专员岗位职责

2014/02/26 职场文书

2014年大班元旦活动方案

2014/02/26 职场文书

电子信息工程自荐信

2014/05/26 职场文书

售房委托书

2014/08/30 职场文书

党员教师自我剖析材料

2014/09/29 职场文书

干部职工纪律作风整改措施思想汇报

2014/10/11 职场文书

党的群众路线教育实践活动个人整改措施范文

2014/11/04 职场文书

小人国观后感

2015/06/11 职场文书

如何用JavaScript检测当前浏览器是无头浏览器

2021/04/27 Javascript