使用Python的Tornado框架实现一个简单的WebQQ机器人


Posted in Python onApril 24, 2015

我打算将WebQQ单独出来运行, 一开始直接拷贝了pyxmpp2的mainloop, 但是跑起来问题多多, 所以我又研究了利用Tornado进行网络编程(这里), 所以我放弃了Pyxmpp2的mainloop,使用Tornado进行重写

首先放出项目代码
引子

WebQQ协议是一套基于HTTP的QQ协议, 而用Python的urllib2库进行请求太慢, 因为HTTP本身就使用socket请求, 所以改用多路复用I/O模型, 而Tornado简单高效, 看过代码后可以轻松上手.平台兼容性很好, 所以选择Tornado作为网络框架.
原理

首先实现了一个 HTTPStream类, 其主要接口是add_request方法, 它接受一个必选参数:request 是一个 urllib2.Request的实例, 和一个可选参数:readback是一个接受一个urllib2.urlopen(request)返回的Response参数的读取函数, 代码如下:

class HTTPStream(object):
  # 省略若干代码
  def add_request(self, request, readback = None):
    if not isinstance(request, urllib2.Request):
      raise ValueError, "Not a invaid requset"

    # 此处易触发timeout异常, 省略处理异常代码
    sock, data = self.http_sock.make_http_sock_data(request)

    fd = sock.fileno()
    self.fd_map[fd] = sock
    self.fd_request_map[fd] = request
    callback = partial(self._handle_events, request, data, readback)
    self.ioloop.add_handler(fd, callback, IOLoop.WRITE)

HTTPStream.add_request将urllib2.Request的实例解析出一个socket和一个用于socket发送的数据.前面文章介绍过了, tornado.ioloop.IOLoop.add_handler用于将注册socket, 其需要三个参数: socket的文件描述符, 接受文件描述符和事件参数的回调, 和注册的事件.

我们用到的回调是HTTPStream._handle_events:

class HTTPStream(object):
  # 省略若干代码
  def _handle_events(self, request, data, readback, fd, event):
    """ 用于处理Tornado事件
    Arguments:
      `request`  -  urllib.Request
      `data`   -  socket要写入的数据
      `readback` -  读取函数
      以上参数应当使用partial封装然后将此方法作为IOLoop.add_handler的callback
      `fd`    -  IOLoop传递 文件描述符
      `event`   -  IOLoop传递 tornado
    """
    s = self.fd_map[fd]

    if event & IOLoop.READ:
      # 省略错误处理
      resp = self.http_sock.make_response(s, request)
      args = readback(resp)
      s.setblocking(False)
      if args and len(args) == 3:
        t = threading.Thread(target = self.add_delay_request, args = args)
        t.setDaemon(True)
        t.start()

      if args and len(args) == 2:
        self.add_request(*args)
      self.ioloop.remove_handler(fd)

    if event & IOLoop.WRITE:
      s.sendall(data)
      if readback:
        self.ioloop.update_handler(fd, IOLoop.READ)
      else:
        self.ioloop.remove_handler(fd)

    if event & IOLoop.ERROR:
      pass

它接受的参数上面注释写的很清楚, 不做解释, 所以将此方法通过functools.partial封装做为callback传递给tornado.ioloop.IOLoop.add_handler, 并注册为写事件, 以便发送HTTP请求.

HTTPStream._handle_events用于处理事件, 当事件为写时就发送HTTP请求(根据urllib2.Request生成的用于发送的数据), 并判断是否有读取函数, 有则注册读事件, 当事件为读时就从socket中构建一个Response并传递给读取函数, 读取函数会返回3个值, 分别为: 下一个请求, 请求的读取函数(可为None, 为None则只请求不读取), 下一个请求的延迟(多长事件后添加此请求, 可选, 单位为秒)

依据读取函数返回的三个值来确定下一个请求, 并完成一系列的请求. 更加完整的代码请参见文章开头给出的项目代码

HTTPStream.http_sock.make_response执行时会将socket设为阻塞, 因为不设置阻塞会出现httplib.BadStatusLine异常.读取函数执行完毕,重新将socket设置为非阻塞, 并移除此socket(虽然做了这样的处理但是QQ连接时间稍长还是会触发httplib.BadStatusLine异常)

Python 相关文章推荐
python实现搜索指定目录下文件及文件内搜索指定关键词的方法
Jun 28 Python
python修改字典内key对应值的方法
Jul 11 Python
mac PyCharm添加Python解释器及添加package路径的方法
Oct 29 Python
Python实现分段线性插值
Dec 17 Python
Python使用线程来接收串口数据的示例
Jul 02 Python
python变量的存储原理详解
Jul 10 Python
查看端口并杀进程python脚本代码
Dec 17 Python
Python 过滤错误log并导出的实例
Dec 26 Python
Python Pickle 实现在同一个文件中序列化多个对象
Dec 30 Python
Python使用pdb调试代码的技巧
May 03 Python
python根据用户需求输入想爬取的内容及页数爬取图片方法详解
Aug 03 Python
python爬取网易云音乐热歌榜实例代码
Aug 07 Python
Python程序中使用SQLAlchemy时出现乱码的解决方案
Apr 24 #Python
简单说明Python中的装饰器的用法
Apr 24 #Python
使用基于Python的Tornado框架的HTTP客户端的教程
Apr 24 #Python
简单介绍Python的Tornado框架中的协程异步实现原理
Apr 23 #Python
解决Python中由于logging模块误用导致的内存泄露
Apr 23 #Python
粗略分析Python中的内存泄漏
Apr 23 #Python
使用beaker让Facebook的Bottle框架支持session功能
Apr 23 #Python
You might like
php获取通过http协议post提交过来xml数据及解析xml
2012/12/16 PHP
php下pdo的mysql事务处理用法实例
2014/12/27 PHP
PHP获取一年有几周以及每周开始日期和结束日期
2015/08/06 PHP
php删除数组中重复元素的方法
2015/12/22 PHP
几行代码轻松搞定jquery实现flash8类似的连接效果
2007/05/03 Javascript
javascript之解决IE下不渲染的bug
2007/06/29 Javascript
document.onreadystatechange事件的用法分析
2009/10/17 Javascript
基于OO的动画附加插件,可以实现弹跳、渐隐等动画效果 分享
2013/06/24 Javascript
浅析Js(Jquery)中,字符串与JSON格式互相转换的示例(直接运行实例)
2013/07/09 Javascript
Jquery 跨域访问 Lightswitch OData Service的方法
2013/09/11 Javascript
js 获取、清空input type="file"的值(示例代码)
2013/12/24 Javascript
js贪吃蛇网页版游戏特效代码分享(挑战十关)
2015/08/24 Javascript
jQuery实现的网页右下角tab样式在线客服效果代码
2015/10/23 Javascript
详解Javascript数据类型的转换规则
2016/12/12 Javascript
AngularJS自定义指令实现面包屑功能完整实例
2017/05/17 Javascript
vue-awesome-swiper滑块插件使用方法详解
2017/11/27 Javascript
Python中使用select模块实现非阻塞的IO
2015/02/03 Python
Python 爬虫模拟登陆知乎
2016/09/23 Python
Python队列RabbitMQ 使用方法实例记录
2019/08/05 Python
解决Atom安装Hydrogen无法运行python3的问题
2019/08/28 Python
pytorch动态网络以及权重共享实例
2020/01/06 Python
pycharm双击无响应(打不开问题解决办法)
2020/01/10 Python
使用Python3 poplib模块删除服务器多天前的邮件实现代码
2020/04/24 Python
使用pth文件添加Python环境变量方式
2020/05/26 Python
Html5游戏开发之乒乓Ping Pong游戏示例(三)
2013/01/21 HTML / CSS
Linux面试题LINUX系统类
2014/11/19 面试题
ruby如何进行集成操作?Ruby能进行多重继承吗?
2013/10/16 面试题
涉外经济法专业毕业生推荐信
2013/11/24 职场文书
2014爱耳日宣传教育活动总结
2014/03/09 职场文书
2014年最新学习全国两会精神心得
2014/03/17 职场文书
班级口号大全
2014/06/09 职场文书
奥运会口号
2014/06/13 职场文书
英语课前三分钟演讲稿(6篇)
2014/09/13 职场文书
考试作弊检讨书1000字(5篇)
2014/10/19 职场文书
婚宴致辞
2015/07/28 职场文书
sqlserver连接错误之SQL评估期已过的问题解决
2022/03/23 SQL Server