使用Python的Tornado框架实现一个简单的WebQQ机器人


Posted in Python onApril 24, 2015

我打算将WebQQ单独出来运行, 一开始直接拷贝了pyxmpp2的mainloop, 但是跑起来问题多多, 所以我又研究了利用Tornado进行网络编程(这里), 所以我放弃了Pyxmpp2的mainloop,使用Tornado进行重写

首先放出项目代码
引子

WebQQ协议是一套基于HTTP的QQ协议, 而用Python的urllib2库进行请求太慢, 因为HTTP本身就使用socket请求, 所以改用多路复用I/O模型, 而Tornado简单高效, 看过代码后可以轻松上手.平台兼容性很好, 所以选择Tornado作为网络框架.
原理

首先实现了一个 HTTPStream类, 其主要接口是add_request方法, 它接受一个必选参数:request 是一个 urllib2.Request的实例, 和一个可选参数:readback是一个接受一个urllib2.urlopen(request)返回的Response参数的读取函数, 代码如下:

class HTTPStream(object):
  # 省略若干代码
  def add_request(self, request, readback = None):
    if not isinstance(request, urllib2.Request):
      raise ValueError, "Not a invaid requset"

    # 此处易触发timeout异常, 省略处理异常代码
    sock, data = self.http_sock.make_http_sock_data(request)

    fd = sock.fileno()
    self.fd_map[fd] = sock
    self.fd_request_map[fd] = request
    callback = partial(self._handle_events, request, data, readback)
    self.ioloop.add_handler(fd, callback, IOLoop.WRITE)

HTTPStream.add_request将urllib2.Request的实例解析出一个socket和一个用于socket发送的数据.前面文章介绍过了, tornado.ioloop.IOLoop.add_handler用于将注册socket, 其需要三个参数: socket的文件描述符, 接受文件描述符和事件参数的回调, 和注册的事件.

我们用到的回调是HTTPStream._handle_events:

class HTTPStream(object):
  # 省略若干代码
  def _handle_events(self, request, data, readback, fd, event):
    """ 用于处理Tornado事件
    Arguments:
      `request`  -  urllib.Request
      `data`   -  socket要写入的数据
      `readback` -  读取函数
      以上参数应当使用partial封装然后将此方法作为IOLoop.add_handler的callback
      `fd`    -  IOLoop传递 文件描述符
      `event`   -  IOLoop传递 tornado
    """
    s = self.fd_map[fd]

    if event & IOLoop.READ:
      # 省略错误处理
      resp = self.http_sock.make_response(s, request)
      args = readback(resp)
      s.setblocking(False)
      if args and len(args) == 3:
        t = threading.Thread(target = self.add_delay_request, args = args)
        t.setDaemon(True)
        t.start()

      if args and len(args) == 2:
        self.add_request(*args)
      self.ioloop.remove_handler(fd)

    if event & IOLoop.WRITE:
      s.sendall(data)
      if readback:
        self.ioloop.update_handler(fd, IOLoop.READ)
      else:
        self.ioloop.remove_handler(fd)

    if event & IOLoop.ERROR:
      pass

它接受的参数上面注释写的很清楚, 不做解释, 所以将此方法通过functools.partial封装做为callback传递给tornado.ioloop.IOLoop.add_handler, 并注册为写事件, 以便发送HTTP请求.

HTTPStream._handle_events用于处理事件, 当事件为写时就发送HTTP请求(根据urllib2.Request生成的用于发送的数据), 并判断是否有读取函数, 有则注册读事件, 当事件为读时就从socket中构建一个Response并传递给读取函数, 读取函数会返回3个值, 分别为: 下一个请求, 请求的读取函数(可为None, 为None则只请求不读取), 下一个请求的延迟(多长事件后添加此请求, 可选, 单位为秒)

依据读取函数返回的三个值来确定下一个请求, 并完成一系列的请求. 更加完整的代码请参见文章开头给出的项目代码

HTTPStream.http_sock.make_response执行时会将socket设为阻塞, 因为不设置阻塞会出现httplib.BadStatusLine异常.读取函数执行完毕,重新将socket设置为非阻塞, 并移除此socket(虽然做了这样的处理但是QQ连接时间稍长还是会触发httplib.BadStatusLine异常)

Python 相关文章推荐
Python常用随机数与随机字符串方法实例
Apr 09 Python
Python使用CMD模块更优雅的运行脚本
May 11 Python
Python环境变量设置方法
Aug 28 Python
Numpy数组的保存与读取方法
Apr 04 Python
深入浅析python 中的匿名函数
May 21 Python
利用Python写一个爬妹子的爬虫
Jun 08 Python
浅谈利用numpy对矩阵进行归一化处理的方法
Jul 11 Python
python用opencv批量截取图像指定区域的方法
Jan 24 Python
Python实现判断一个整数是否为回文数算法示例
Mar 02 Python
解决Django 在ForeignKey中出现 non-nullable field错误的问题
Aug 06 Python
python文件编写好后如何实践
Jul 07 Python
Python logging模块进行封装实现原理解析
Aug 07 Python
Python程序中使用SQLAlchemy时出现乱码的解决方案
Apr 24 #Python
简单说明Python中的装饰器的用法
Apr 24 #Python
使用基于Python的Tornado框架的HTTP客户端的教程
Apr 24 #Python
简单介绍Python的Tornado框架中的协程异步实现原理
Apr 23 #Python
解决Python中由于logging模块误用导致的内存泄露
Apr 23 #Python
粗略分析Python中的内存泄漏
Apr 23 #Python
使用beaker让Facebook的Bottle框架支持session功能
Apr 23 #Python
You might like
杏林同学录(八)
2006/10/09 PHP
隐藏Nginx或Apache以及PHP的版本号的方法
2016/01/03 PHP
PHP抓取淘宝商品的用户晒单评论+图片+搜索商品列表实例
2016/04/14 PHP
浅谈socket同步和异步、阻塞和非阻塞、I/O模型
2016/12/15 PHP
php curl常用的5个经典例子
2017/01/20 PHP
php实现微信公众号企业转账功能
2018/10/01 PHP
firefo xml 读写实现js代码
2009/06/11 Javascript
JavaScript游戏之是男人就下100层代码打包
2010/11/08 Javascript
JQuery调用WebServices的方法和4个实例
2014/05/06 Javascript
JavaScript实现99乘法表及隔行变色实例代码
2016/02/24 Javascript
jQuery常用样式操作实例分析(获取、设置、追加、删除、判断等)
2016/09/08 Javascript
webpack学习笔记之优化缓存、合并、懒加载
2017/08/24 Javascript
聊聊JS动画库 Velocity.js的使用
2018/03/13 Javascript
webpack本地开发环境无法用IP访问的解决方法
2018/03/20 Javascript
记录微信小程序 height: calc(xx - xx);无效问题
2019/12/30 Javascript
python基础教程之字典操作详解
2014/03/25 Python
使用IPython下的Net-SNMP来管理类UNIX系统的教程
2015/04/15 Python
Python 模拟购物车的实例讲解
2017/09/11 Python
django限制匿名用户访问及重定向的方法实例
2018/02/07 Python
Tensorflow之构建自己的图片数据集TFrecords的方法
2018/02/07 Python
python:print格式化输出到文件的实例
2018/05/14 Python
Python3实现的回文数判断及罗马数字转整数算法示例
2019/03/27 Python
Python实现 版本号对比功能的实例代码
2019/04/18 Python
Python descriptor(描述符)的实现
2020/11/15 Python
Python爬取某平台短视频的方法
2021/02/08 Python
CSS3 box-shadow属性实例详解
2020/06/19 HTML / CSS
HTML5的新特性(1)
2016/03/03 HTML / CSS
英国最大的电子零件及配件零售商:Partmaster
2017/04/24 全球购物
世界上第一个水枕头:Mediflow
2018/12/06 全球购物
软件测试英文面试题
2012/10/14 面试题
历史学专业推荐信
2013/11/06 职场文书
奥巴马竞选演讲稿
2014/05/15 职场文书
教师演讲稿大全
2014/05/16 职场文书
房屋买卖定金协议书
2016/03/21 职场文书
MySQL 使用SQL语句修改表名的实现
2021/04/07 MySQL
oracle通过存储过程上传list保存功能
2021/05/12 Oracle