在Python的Tornado框架中实现简单的在线代理的教程


Posted in Python onMay 02, 2015

实现代理的方式很多种,流行的web服务器也大都有代理的功能,比如http://www.tornadoweb.cn用的就是nginx的代理功能做的tornadoweb官网的镜像。

最近,我在开发一个移动运用(以下简称APP)的后台程序(Server),该运用需要调用到另一平台产品(Platform)的API。对于这个系统来说,可选的一种实现方式方式是APP同时跟Server&Platform两者交互;另一种则在Server端封装掉Platform的API,APP只和Server交互。显然后一种方式的系统架构会清晰些,APP编程时也就相对简单。那么如何在Server端封装Platform的API呢,我首先考虑到的就是用代理的方式来实现。碰巧最近Tornado邮件群组里有人在讨论using Tornado as a proxy,贴主提到的运用场景跟我这碰到的场景非常的相似,我把原帖的代码做了些整理和简化,源代码如下:

# -*- coding: utf-8 -*-
#
# Copyright(c) 2011 Felinx Lee & http://feilong.me/
#
# Licensed under the Apache License, Version 2.0 (the "License"); you may
# not use this file except in compliance with the License. You may obtain
# a copy of the License at
#
#   http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
# WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the
# License for the specific language governing permissions and limitations
# under the License.
 
import logging
 
import tornado.httpserver
import tornado.ioloop
import tornado.options
import tornado.web
import tornado.httpclient
from tornado.web import HTTPError, asynchronous
from tornado.httpclient import HTTPRequest
from tornado.options import define, options
try:
  from tornado.curl_httpclient import CurlAsyncHTTPClient as AsyncHTTPClient
except ImportError:
  from tornado.simple_httpclient import SimpleAsyncHTTPClient as AsyncHTTPClient
 
define("port", default=8888, help="run on the given port", type=int)
define("api_protocol", default="http")
define("api_host", default="feilong.me")
define("api_port", default="80")
define("debug", default=True, type=bool)
 
class ProxyHandler(tornado.web.RequestHandler):
  @asynchronous
  def get(self):
    # enable API GET request when debugging
    if options.debug:
      return self.post()
    else:
      raise HTTPError(405)
 
  @asynchronous
  def post(self):
    protocol = options.api_protocol
    host = options.api_host
    port = options.api_port
 
    # port suffix
    port = "" if port == "80" else ":%s" % port
 
    uri = self.request.uri
    url = "%s://%s%s%s" % (protocol, host, port, uri)
 
    # update host to destination host
    headers = dict(self.request.headers)
    headers["Host"] = host
 
    try:
      AsyncHTTPClient().fetch(
        HTTPRequest(url=url,
              method="POST",
              body=self.request.body,
              headers=headers,
              follow_redirects=False),
        self._on_proxy)
    except tornado.httpclient.HTTPError, x:
      if hasattr(x, "response") and x.response:
        self._on_proxy(x.response)
      else:
        logging.error("Tornado signalled HTTPError %s", x)
 
  def _on_proxy(self, response):
    if response.error and not isinstance(response.error,
                       tornado.httpclient.HTTPError):
      raise HTTPError(500)
    else:
      self.set_status(response.code)
      for header in ("Date", "Cache-Control", "Server", "Content-Type", "Location"):
        v = response.headers.get(header)
        if v:
          self.set_header(header, v)
      if response.body:
        self.write(response.body)
      self.finish()
 
def main():
  tornado.options.parse_command_line()
  application = tornado.web.Application([
    (r"/.*", ProxyHandler),
  ])
  http_server = tornado.httpserver.HTTPServer(application)
  http_server.listen(options.port)
  tornado.ioloop.IOLoop.instance().start()
 
if __name__ == "__main__":
  main()

运行上面的代码后,访问 http://localhost:8888/ 将会完整显示飞龙博客的首页,即代理访问了http://feilong.me/的内容。

我考虑用程序的方式来做代理而不是直接用Nginx来做代理,其中一点是考虑到用程序可以很容易的控制Platform的哪些API是需要代理的,而哪些是要屏蔽掉的,还有哪些可能是要重写的(比如Server的login可能不能直接代理Platform的login,但却要调用到Platform的login API)。

以上这段代码只是做了简单的页面内容代理,并没有对页面进行进一步的解析处理,比如链接替换等,这些就交个有兴趣的朋友去开发了。基于以上这段代码,将其扩展一下,是完全可以实现一个完整的在线代理程序的。

这段代码我已放到了我的实验项目里,见https://bitbucket.org/felinx/labs,我将会放更多类似于这样的实验性质的小项目到这个repository里来,有兴趣的朋友可以关注一下。

转载请注明出处:http://feilong.me/2011/09/tornado-as-a-proxy

Python 相关文章推荐
在Python中使用M2Crypto模块实现AES加密的教程
Apr 08 Python
python嵌套函数使用外部函数变量的方法(Python2和Python3)
Jan 31 Python
python 上下文管理器使用方法小结
Oct 10 Python
python opencv旋转图像(保持图像不被裁减)
Jul 26 Python
kaggle+mnist实现手写字体识别
Jul 26 Python
windows下python虚拟环境virtualenv安装和使用详解
Jul 16 Python
python gdal安装与简单使用
Aug 01 Python
Python中list循环遍历删除数据的正确方法
Sep 02 Python
Tensorflow限制CPU个数实例
Feb 06 Python
浅谈numpy中np.array()与np.asarray的区别以及.tolist
Jun 03 Python
python 动态渲染 mysql 配置文件的示例
Nov 20 Python
python爬虫实现爬取同一个网站的多页数据的实例讲解
Jan 18 Python
探究Python的Tornado框架对子域名和泛域名的支持
May 02 #Python
Python编程中运用闭包时所需要注意的一些地方
May 02 #Python
按日期打印Python的Tornado框架中的日志的方法
May 02 #Python
详细解读Python的web.py框架下的application.py模块
May 02 #Python
使用Python的web.py框架实现类似Django的ORM查询的教程
May 02 #Python
在ironpython中利用装饰器执行SQL操作的例子
May 02 #Python
用Python编写简单的定时器的方法
May 02 #Python
You might like
基于wordpress主题制作的具体实现步骤
2013/05/10 PHP
解析curl提交GET,POST,Cookie的简单方法
2013/06/29 PHP
PHP读取、解析eml文件及生成网页的方法示例
2017/09/04 PHP
PHP Post获取不到非表单数据的问题解决办法
2018/02/27 PHP
ajax无刷新动态调用股票信息(改良版)
2008/11/01 Javascript
JavaScript 对话框和状态栏使用说明
2009/10/25 Javascript
按给定几率进行随机抽取的js代码
2010/12/28 Javascript
js中AppendChild与insertBefore的用法详细解析
2013/12/16 Javascript
JavaScript  cookie 跨域访问之广告推广
2016/04/20 Javascript
jQuery Mobile中的button按钮组件基础使用教程
2016/05/23 Javascript
Vue实现路由跳转和嵌套
2017/06/20 Javascript
Node.js如何使用Diffie-Hellman密钥交换算法详解
2017/09/05 Javascript
元素全屏的设置与监听实例
2017/11/28 Javascript
详解Vue单元测试case写法
2018/05/24 Javascript
详解Webpack多环境代码打包的方法
2018/08/03 Javascript
JavaScript设计模式之命令模式实例分析
2019/01/16 Javascript
原生JavaScript实现刮刮乐
2020/09/29 Javascript
vue 数据遍历筛选 过滤 排序的应用操作
2020/11/17 Javascript
[02:04]2014DOTA2国际邀请赛 BBC小组赛第三天总结
2014/07/12 DOTA
Python设计模式之命令模式简单示例
2018/01/10 Python
python实现windows下文件备份脚本
2018/05/27 Python
python flask实现分页的示例代码
2018/08/02 Python
简单了解python 生成器 列表推导式 生成器表达式
2019/08/22 Python
Python根据服务获取端口号的方法
2019/09/25 Python
python3 pillow模块实现简单验证码
2019/10/31 Python
Python networkx包的实现
2020/02/14 Python
Python如何定义接口和抽象类
2020/07/28 Python
Django3中的自定义用户模型实例详解
2020/08/23 Python
html5图片上传预览示例分享
2014/04/14 HTML / CSS
J2EE中常用的名词进行解释
2015/11/09 面试题
大学生自我鉴定范文
2013/12/28 职场文书
观看《永远的雷锋》心得体会
2014/03/12 职场文书
事业单位年度考核个人总结
2015/02/12 职场文书
2015年外联部工作总结
2015/04/03 职场文书
2015最新民情日记范文
2015/06/26 职场文书
MySQL创建表操作命令分享
2022/03/25 MySQL