在Python的Tornado框架中实现简单的在线代理的教程


Posted in Python onMay 02, 2015

实现代理的方式很多种,流行的web服务器也大都有代理的功能,比如http://www.tornadoweb.cn用的就是nginx的代理功能做的tornadoweb官网的镜像。

最近,我在开发一个移动运用(以下简称APP)的后台程序(Server),该运用需要调用到另一平台产品(Platform)的API。对于这个系统来说,可选的一种实现方式方式是APP同时跟Server&Platform两者交互;另一种则在Server端封装掉Platform的API,APP只和Server交互。显然后一种方式的系统架构会清晰些,APP编程时也就相对简单。那么如何在Server端封装Platform的API呢,我首先考虑到的就是用代理的方式来实现。碰巧最近Tornado邮件群组里有人在讨论using Tornado as a proxy,贴主提到的运用场景跟我这碰到的场景非常的相似,我把原帖的代码做了些整理和简化,源代码如下:

# -*- coding: utf-8 -*-
#
# Copyright(c) 2011 Felinx Lee & http://feilong.me/
#
# Licensed under the Apache License, Version 2.0 (the "License"); you may
# not use this file except in compliance with the License. You may obtain
# a copy of the License at
#
#   http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS, WITHOUT
# WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. See the
# License for the specific language governing permissions and limitations
# under the License.
 
import logging
 
import tornado.httpserver
import tornado.ioloop
import tornado.options
import tornado.web
import tornado.httpclient
from tornado.web import HTTPError, asynchronous
from tornado.httpclient import HTTPRequest
from tornado.options import define, options
try:
  from tornado.curl_httpclient import CurlAsyncHTTPClient as AsyncHTTPClient
except ImportError:
  from tornado.simple_httpclient import SimpleAsyncHTTPClient as AsyncHTTPClient
 
define("port", default=8888, help="run on the given port", type=int)
define("api_protocol", default="http")
define("api_host", default="feilong.me")
define("api_port", default="80")
define("debug", default=True, type=bool)
 
class ProxyHandler(tornado.web.RequestHandler):
  @asynchronous
  def get(self):
    # enable API GET request when debugging
    if options.debug:
      return self.post()
    else:
      raise HTTPError(405)
 
  @asynchronous
  def post(self):
    protocol = options.api_protocol
    host = options.api_host
    port = options.api_port
 
    # port suffix
    port = "" if port == "80" else ":%s" % port
 
    uri = self.request.uri
    url = "%s://%s%s%s" % (protocol, host, port, uri)
 
    # update host to destination host
    headers = dict(self.request.headers)
    headers["Host"] = host
 
    try:
      AsyncHTTPClient().fetch(
        HTTPRequest(url=url,
              method="POST",
              body=self.request.body,
              headers=headers,
              follow_redirects=False),
        self._on_proxy)
    except tornado.httpclient.HTTPError, x:
      if hasattr(x, "response") and x.response:
        self._on_proxy(x.response)
      else:
        logging.error("Tornado signalled HTTPError %s", x)
 
  def _on_proxy(self, response):
    if response.error and not isinstance(response.error,
                       tornado.httpclient.HTTPError):
      raise HTTPError(500)
    else:
      self.set_status(response.code)
      for header in ("Date", "Cache-Control", "Server", "Content-Type", "Location"):
        v = response.headers.get(header)
        if v:
          self.set_header(header, v)
      if response.body:
        self.write(response.body)
      self.finish()
 
def main():
  tornado.options.parse_command_line()
  application = tornado.web.Application([
    (r"/.*", ProxyHandler),
  ])
  http_server = tornado.httpserver.HTTPServer(application)
  http_server.listen(options.port)
  tornado.ioloop.IOLoop.instance().start()
 
if __name__ == "__main__":
  main()

运行上面的代码后,访问 http://localhost:8888/ 将会完整显示飞龙博客的首页,即代理访问了http://feilong.me/的内容。

我考虑用程序的方式来做代理而不是直接用Nginx来做代理,其中一点是考虑到用程序可以很容易的控制Platform的哪些API是需要代理的,而哪些是要屏蔽掉的,还有哪些可能是要重写的(比如Server的login可能不能直接代理Platform的login,但却要调用到Platform的login API)。

以上这段代码只是做了简单的页面内容代理,并没有对页面进行进一步的解析处理,比如链接替换等,这些就交个有兴趣的朋友去开发了。基于以上这段代码,将其扩展一下,是完全可以实现一个完整的在线代理程序的。

这段代码我已放到了我的实验项目里,见https://bitbucket.org/felinx/labs,我将会放更多类似于这样的实验性质的小项目到这个repository里来,有兴趣的朋友可以关注一下。

转载请注明出处:http://feilong.me/2011/09/tornado-as-a-proxy

Python 相关文章推荐
python实现提取百度搜索结果的方法
May 19 Python
python实现基本进制转换的方法
Jul 11 Python
利用Tkinter和matplotlib两种方式画饼状图的实例
Nov 06 Python
对python for 文件指定行读写操作详解
Dec 29 Python
python3安装crypto出错及解决方法
Jul 30 Python
Python 3.8正式发布,来尝鲜这些新特性吧
Oct 15 Python
基于python及pytorch中乘法的使用详解
Dec 27 Python
将tensorflow模型打包成PB文件及PB文件读取方式
Jan 23 Python
python库skimage给灰度图像染色的方法示例
Apr 27 Python
Python3之乱码\xe6\x97\xa0\xe6\xb3\x95处理方式
May 11 Python
Python使用Pygame绘制时钟
Nov 29 Python
python 远程执行命令的详细代码
Feb 15 Python
探究Python的Tornado框架对子域名和泛域名的支持
May 02 #Python
Python编程中运用闭包时所需要注意的一些地方
May 02 #Python
按日期打印Python的Tornado框架中的日志的方法
May 02 #Python
详细解读Python的web.py框架下的application.py模块
May 02 #Python
使用Python的web.py框架实现类似Django的ORM查询的教程
May 02 #Python
在ironpython中利用装饰器执行SQL操作的例子
May 02 #Python
用Python编写简单的定时器的方法
May 02 #Python
You might like
用缓存实现静态页面的测试
2006/12/06 PHP
基于PHP如何把汉字转化为拼音
2015/12/11 PHP
php删除数组中重复元素的方法
2015/12/22 PHP
PHP使用Redis替代文件存储Session的方法
2017/02/15 PHP
ThinkPHP框架实现导出excel数据的方法示例【基于PHPExcel】
2018/05/12 PHP
js Flash插入函数免激活代码
2009/03/31 Javascript
asp.net HttpHandler实现图片防盗链
2009/11/09 Javascript
jQuery的DOM操作之删除节点示例
2014/01/03 Javascript
new Date()问题在ie8下面的处理方法
2014/07/31 Javascript
jQuery中parentsUntil()方法用法实例
2015/01/07 Javascript
jQuery图片瀑布流的简单实现代码
2017/03/15 Javascript
关于定制FileField中的上传文件名称问题
2017/08/22 Javascript
vue.js简单配置axios的方法详解
2017/12/13 Javascript
vue 权限认证token的实现方法
2018/07/17 Javascript
angular使用md5,CryptoJS des加密的方法
2019/06/03 Javascript
[47:50]Secret vs VP 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/20 DOTA
[04:59]DOTA2-DPC中国联赛 正赛 Ehome vs iG 选手采访
2021/03/11 DOTA
python 运算符 供重载参考
2009/06/11 Python
通过python下载FTP上的文件夹的实现代码
2013/02/10 Python
python实现读取excel写入mysql的小工具详解
2017/11/20 Python
Python Django实现layui风格+django分页功能的例子
2019/08/29 Python
python垃圾回收机制(GC)原理解析
2019/12/30 Python
python+OpenCV实现图像拼接
2020/03/05 Python
摩顿布朗英国官方网上商店:奢华沐浴、身体和头发护理
2016/10/29 全球购物
美国在线轮胎零售商:SimpleTire
2019/04/08 全球购物
UML设计模式笔试题
2014/06/07 面试题
中专生自荐信
2013/10/12 职场文书
学习十八大坚定理想信念心得体会
2014/03/11 职场文书
电子专业求职信
2014/06/19 职场文书
世界水日宣传活动总结
2015/02/09 职场文书
2015年三年级班主任工作总结
2015/05/21 职场文书
校运会通讯稿
2015/07/18 职场文书
入党转正申请自我鉴定
2019/06/25 职场文书
详解nodejs内置模块
2021/05/06 NodeJs
python迷宫问题深度优先遍历实例
2021/06/20 Python
JS轻量级函数式编程实现XDM二
2022/06/16 Javascript