在Python的Tornado框架中实现简单的在线代理的教程


Posted in Python onMay 02, 2015

实现代理的方式很多种,流行的web服务器也大都有代理的功能,比如http://www.tornadoweb.cn用的就是nginx的代理功能做的tornadoweb官网的镜像。

最近,我在开发一个移动运用(以下简称APP)的后台程序(Server),该运用需要调用到另一平台产品(Platform)的API。对于这个系统来说,可选的一种实现方式方式是APP同时跟Server&Platform两者交互;另一种则在Server端封装掉Platform的API,APP只和Server交互。显然后一种方式的系统架构会清晰些,APP编程时也就相对简单。那么如何在Server端封装Platform的API呢,我首先考虑到的就是用代理的方式来实现。碰巧最近Tornado邮件群组里有人在讨论using Tornado as a proxy,贴主提到的运用场景跟我这碰到的场景非常的相似,我把原帖的代码做了些整理和简化,源代码如下:

# -*- coding: utf-8 -*-
#
# Copyright(c) 2011 Felinx Lee & http://feilong.me/
#
# Licensed under the Apache License, Version 2.0 (the "License"); you may
# not use this file except in compliance with the License. You may obtain
# a copy of the License at
#
#   http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
# WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the
# License for the specific language governing permissions and limitations
# under the License.
 
import logging
 
import tornado.httpserver
import tornado.ioloop
import tornado.options
import tornado.web
import tornado.httpclient
from tornado.web import HTTPError, asynchronous
from tornado.httpclient import HTTPRequest
from tornado.options import define, options
try:
  from tornado.curl_httpclient import CurlAsyncHTTPClient as AsyncHTTPClient
except ImportError:
  from tornado.simple_httpclient import SimpleAsyncHTTPClient as AsyncHTTPClient
 
define("port", default=8888, help="run on the given port", type=int)
define("api_protocol", default="http")
define("api_host", default="feilong.me")
define("api_port", default="80")
define("debug", default=True, type=bool)
 
class ProxyHandler(tornado.web.RequestHandler):
  @asynchronous
  def get(self):
    # enable API GET request when debugging
    if options.debug:
      return self.post()
    else:
      raise HTTPError(405)
 
  @asynchronous
  def post(self):
    protocol = options.api_protocol
    host = options.api_host
    port = options.api_port
 
    # port suffix
    port = "" if port == "80" else ":%s" % port
 
    uri = self.request.uri
    url = "%s://%s%s%s" % (protocol, host, port, uri)
 
    # update host to destination host
    headers = dict(self.request.headers)
    headers["Host"] = host
 
    try:
      AsyncHTTPClient().fetch(
        HTTPRequest(url=url,
              method="POST",
              body=self.request.body,
              headers=headers,
              follow_redirects=False),
        self._on_proxy)
    except tornado.httpclient.HTTPError, x:
      if hasattr(x, "response") and x.response:
        self._on_proxy(x.response)
      else:
        logging.error("Tornado signalled HTTPError %s", x)
 
  def _on_proxy(self, response):
    if response.error and not isinstance(response.error,
                       tornado.httpclient.HTTPError):
      raise HTTPError(500)
    else:
      self.set_status(response.code)
      for header in ("Date", "Cache-Control", "Server", "Content-Type", "Location"):
        v = response.headers.get(header)
        if v:
          self.set_header(header, v)
      if response.body:
        self.write(response.body)
      self.finish()
 
def main():
  tornado.options.parse_command_line()
  application = tornado.web.Application([
    (r"/.*", ProxyHandler),
  ])
  http_server = tornado.httpserver.HTTPServer(application)
  http_server.listen(options.port)
  tornado.ioloop.IOLoop.instance().start()
 
if __name__ == "__main__":
  main()

运行上面的代码后,访问 http://localhost:8888/ 将会完整显示飞龙博客的首页,即代理访问了http://feilong.me/的内容。

我考虑用程序的方式来做代理而不是直接用Nginx来做代理,其中一点是考虑到用程序可以很容易的控制Platform的哪些API是需要代理的,而哪些是要屏蔽掉的,还有哪些可能是要重写的(比如Server的login可能不能直接代理Platform的login,但却要调用到Platform的login API)。

以上这段代码只是做了简单的页面内容代理,并没有对页面进行进一步的解析处理,比如链接替换等,这些就交个有兴趣的朋友去开发了。基于以上这段代码,将其扩展一下,是完全可以实现一个完整的在线代理程序的。

这段代码我已放到了我的实验项目里,见https://bitbucket.org/felinx/labs,我将会放更多类似于这样的实验性质的小项目到这个repository里来,有兴趣的朋友可以关注一下。

转载请注明出处:http://feilong.me/2011/09/tornado-as-a-proxy

Python 相关文章推荐
从零学python系列之新版本导入httplib模块报ImportError解决方案
May 23 Python
Python的MongoDB模块PyMongo操作方法集锦
Jan 05 Python
星球大战与Python之间的那些事
Jan 07 Python
python获取当前目录路径和上级路径的实例
Apr 26 Python
Python实现的读取电脑硬件信息功能示例
May 30 Python
python协程之动态添加任务的方法
Feb 19 Python
NumPy 数组使用大全
Apr 25 Python
django-rest-framework 自定义swagger过程详解
Jul 18 Python
django中使用Celery 布式任务队列过程详解
Jul 29 Python
计算pytorch标准化(Normalize)所需要数据集的均值和方差实例
Jan 15 Python
selenium切换标签页解决get超时问题的完整代码
Aug 30 Python
如何在windows下安装配置python工具Ulipad
Oct 27 Python
探究Python的Tornado框架对子域名和泛域名的支持
May 02 #Python
Python编程中运用闭包时所需要注意的一些地方
May 02 #Python
按日期打印Python的Tornado框架中的日志的方法
May 02 #Python
详细解读Python的web.py框架下的application.py模块
May 02 #Python
使用Python的web.py框架实现类似Django的ORM查询的教程
May 02 #Python
在ironpython中利用装饰器执行SQL操作的例子
May 02 #Python
用Python编写简单的定时器的方法
May 02 #Python
You might like
为PHP5.4开启Zend OPCode缓存
2014/12/26 PHP
discuz图片顺序混乱解决方案
2015/07/29 PHP
Laravel 队列使用的实现
2019/01/08 PHP
PHP 文件写入和读取操作实例详解【必看篇】
2019/11/04 PHP
脚本收藏iframe
2006/07/21 Javascript
jquery 常用操作方法
2010/01/28 Javascript
Html中JS脚本执行顺序简单举例说明
2010/06/19 Javascript
遍历jquery对象的代码分享
2011/11/02 Javascript
浅析Prototype的模板类 Template
2011/12/07 Javascript
js动画(animate)简单引擎代码示例
2012/12/04 Javascript
jquery mobile changepage的三种传参方法介绍
2013/09/13 Javascript
Js 导出table内容到Excel的简单实例
2013/11/19 Javascript
JavaScript实现简单获取当前网页网址的方法
2015/11/09 Javascript
详解JavaScript节流函数中的Throttle
2016/07/16 Javascript
微信小程序 wx:for的使用实例详解
2017/04/27 Javascript
js神秘的电报密码 哈弗曼编码实现
2019/09/10 Javascript
vue实现多级菜单效果
2019/10/19 Javascript
用vue写一个日历
2020/11/02 Javascript
JavaScript ES 模块的使用
2020/11/12 Javascript
[01:02:00]DOTA2-DPC中国联赛 正赛 Elephant vs IG BO3 第三场 1月24日
2021/03/11 DOTA
探究Python的Tornado框架对子域名和泛域名的支持
2015/05/02 Python
实现python版本的按任意键继续/退出
2016/09/26 Python
对python多线程中Lock()与RLock()锁详解
2019/01/11 Python
对Python中一维向量和一维向量转置相乘的方法详解
2019/08/26 Python
Pyqt5自适应布局实例
2019/12/13 Python
Django-xadmin后台导入json数据及后台显示信息图标和主题更改方式
2020/03/11 Python
在Keras中利用np.random.shuffle()打乱数据集实例
2020/06/15 Python
解决Python3.8运行tornado项目报NotImplementedError错误
2020/09/02 Python
Django2.1.7 查询数据返回json格式的实现
2020/12/29 Python
CSS Grid布局教程之什么是网格布局
2014/12/30 HTML / CSS
幼儿园英语教学反思
2014/01/30 职场文书
适用于所有创业者的创业计划书
2014/02/05 职场文书
校园歌咏比赛主持词
2014/03/18 职场文书
幼儿园儿童节主持词
2014/03/21 职场文书
作息时间调整通知
2015/04/22 职场文书
Java实现简易的分词器功能
2021/06/15 Java/Android