使用Python的Tornado框架实现一个简单的WebQQ机器人


Posted in Python onApril 24, 2015

我打算将WebQQ单独出来运行, 一开始直接拷贝了pyxmpp2的mainloop, 但是跑起来问题多多, 所以我又研究了利用Tornado进行网络编程(这里), 所以我放弃了Pyxmpp2的mainloop,使用Tornado进行重写

首先放出项目代码
引子

WebQQ协议是一套基于HTTP的QQ协议, 而用Python的urllib2库进行请求太慢, 因为HTTP本身就使用socket请求, 所以改用多路复用I/O模型, 而Tornado简单高效, 看过代码后可以轻松上手.平台兼容性很好, 所以选择Tornado作为网络框架.
原理

首先实现了一个 HTTPStream类, 其主要接口是add_request方法, 它接受一个必选参数:request 是一个 urllib2.Request的实例, 和一个可选参数:readback是一个接受一个urllib2.urlopen(request)返回的Response参数的读取函数, 代码如下:

class HTTPStream(object):
  # 省略若干代码
  def add_request(self, request, readback = None):
    if not isinstance(request, urllib2.Request):
      raise ValueError, "Not a invaid requset"

    # 此处易触发timeout异常, 省略处理异常代码
    sock, data = self.http_sock.make_http_sock_data(request)

    fd = sock.fileno()
    self.fd_map[fd] = sock
    self.fd_request_map[fd] = request
    callback = partial(self._handle_events, request, data, readback)
    self.ioloop.add_handler(fd, callback, IOLoop.WRITE)

HTTPStream.add_request将urllib2.Request的实例解析出一个socket和一个用于socket发送的数据.前面文章介绍过了, tornado.ioloop.IOLoop.add_handler用于将注册socket, 其需要三个参数: socket的文件描述符, 接受文件描述符和事件参数的回调, 和注册的事件.

我们用到的回调是HTTPStream._handle_events:

class HTTPStream(object):
  # 省略若干代码
  def _handle_events(self, request, data, readback, fd, event):
    """ 用于处理Tornado事件
    Arguments:
      `request`  -  urllib.Request
      `data`   -  socket要写入的数据
      `readback` -  读取函数
      以上参数应当使用partial封装然后将此方法作为IOLoop.add_handler的callback
      `fd`    -  IOLoop传递 文件描述符
      `event`   -  IOLoop传递 tornado
    """
    s = self.fd_map[fd]

    if event & IOLoop.READ:
      # 省略错误处理
      resp = self.http_sock.make_response(s, request)
      args = readback(resp)
      s.setblocking(False)
      if args and len(args) == 3:
        t = threading.Thread(target = self.add_delay_request, args = args)
        t.setDaemon(True)
        t.start()

      if args and len(args) == 2:
        self.add_request(*args)
      self.ioloop.remove_handler(fd)

    if event & IOLoop.WRITE:
      s.sendall(data)
      if readback:
        self.ioloop.update_handler(fd, IOLoop.READ)
      else:
        self.ioloop.remove_handler(fd)

    if event & IOLoop.ERROR:
      pass

它接受的参数上面注释写的很清楚, 不做解释, 所以将此方法通过functools.partial封装做为callback传递给tornado.ioloop.IOLoop.add_handler, 并注册为写事件, 以便发送HTTP请求.

HTTPStream._handle_events用于处理事件, 当事件为写时就发送HTTP请求(根据urllib2.Request生成的用于发送的数据), 并判断是否有读取函数, 有则注册读事件, 当事件为读时就从socket中构建一个Response并传递给读取函数, 读取函数会返回3个值, 分别为: 下一个请求, 请求的读取函数(可为None, 为None则只请求不读取), 下一个请求的延迟(多长事件后添加此请求, 可选, 单位为秒)

依据读取函数返回的三个值来确定下一个请求, 并完成一系列的请求. 更加完整的代码请参见文章开头给出的项目代码

HTTPStream.http_sock.make_response执行时会将socket设为阻塞, 因为不设置阻塞会出现httplib.BadStatusLine异常.读取函数执行完毕,重新将socket设置为非阻塞, 并移除此socket(虽然做了这样的处理但是QQ连接时间稍长还是会触发httplib.BadStatusLine异常)

Python 相关文章推荐
如何搜索查找并解决Django相关的问题
Jun 30 Python
Python实现并行抓取整站40万条房价数据(可更换抓取城市)
Dec 14 Python
Python简单I/O操作示例
Mar 18 Python
python对象与json相互转换的方法
May 07 Python
Python 实现数据结构-堆栈和队列的操作方法
Jul 17 Python
python实现猜数字游戏
Mar 25 Python
python 将dicom图片转换成jpg图片的实例
Jan 13 Python
Python log模块logging记录打印用法解析
Jan 20 Python
TensorFlow MNIST手写数据集的实现方法
Feb 05 Python
浅谈django 模型类使用save()方法的好处与注意事项
Mar 28 Python
tensorflow实现将ckpt转pb文件的方法
Apr 22 Python
Pycharm Plugins加载失败问题解决方案
Nov 28 Python
Python程序中使用SQLAlchemy时出现乱码的解决方案
Apr 24 #Python
简单说明Python中的装饰器的用法
Apr 24 #Python
使用基于Python的Tornado框架的HTTP客户端的教程
Apr 24 #Python
简单介绍Python的Tornado框架中的协程异步实现原理
Apr 23 #Python
解决Python中由于logging模块误用导致的内存泄露
Apr 23 #Python
粗略分析Python中的内存泄漏
Apr 23 #Python
使用beaker让Facebook的Bottle框架支持session功能
Apr 23 #Python
You might like
php sprintf()函数让你的sql操作更安全
2008/07/23 PHP
通过缓存数据库结果提高PHP性能的原理介绍
2012/09/05 PHP
php中使用$_REQUEST需要注意的一个问题
2013/05/02 PHP
php生成zip压缩文件的方法详解
2013/06/09 PHP
解析php中获取url与物理路径的总结
2013/06/21 PHP
jquery 锁定弹出层实现代码
2010/02/23 Javascript
Dom 结点创建 基础知识
2011/10/01 Javascript
浅谈Javascript事件模拟
2012/06/27 Javascript
Jquery中"$(document).ready(function(){ })"函数的使用详解
2013/12/30 Javascript
JavaScript学习笔记之创建对象
2016/03/25 Javascript
Input文本框随着输入内容多少自动延伸的实现
2017/02/15 Javascript
老生常谈jquery中detach()和remove()的区别
2017/03/02 Javascript
vue省市区三联动下拉选择组件的实现
2017/04/28 Javascript
图解JS原型和原型链实现原理
2020/09/15 Javascript
[55:47]DOTA2上海特级锦标赛C组小组赛#2 LGD VS Newbee第三局
2016/02/27 DOTA
Python回调函数用法实例详解
2015/07/02 Python
深入理解Django中内置的用户认证
2017/10/06 Python
python中hashlib模块用法示例
2017/10/30 Python
浅析Python3爬虫登录模拟
2018/02/07 Python
python修改list中所有元素类型的三种方法
2018/04/09 Python
Python unittest模块用法实例分析
2018/05/25 Python
Python使用add_subplot与subplot画子图操作示例
2018/06/01 Python
在pandas多重索引multiIndex中选定指定索引的行方法
2018/11/16 Python
详解mac python+selenium+Chrome 简单案例
2019/11/08 Python
Python使用matplotlib绘制圆形代码实例
2020/05/27 Python
Python接口自动化系列之unittest结合ddt的使用教程详解
2021/02/23 Python
AmazeUI 列表的实现示例
2020/08/17 HTML / CSS
局域网定义和特性
2016/01/23 面试题
网上祭先烈心得体会
2014/09/01 职场文书
合伙经营协议书范本
2014/09/13 职场文书
项目委托协议书(最新)
2014/09/13 职场文书
党的群众路线教育实践活动制度建设计划
2014/11/03 职场文书
八年级语文教学反思
2016/03/03 职场文书
详解CSS开发过程中的20个快速提升技巧
2021/05/21 HTML / CSS
win10系统xps文件怎么打开?win10打开xps文件的两种操作方法
2022/07/23 数码科技
CSS 实现磨砂玻璃(毛玻璃)效果样式
2023/05/21 HTML / CSS