使用Python生成url短链接的方法


Posted in Python onMay 04, 2015

几乎所有的微薄都提供了缩短网址的服务,其原理就是将一个url地址按照一定的算法生成一段字符串,然后加在一个短域名后面边成了一个新的url地址,数据库中会存放这个短地址和原始的地址,当用户点击这个新的短地址后,短地址服务会根据短域名后面的几个字符串从数据库中读出原来的地址然后页面进行跳转 。

比如新浪微薄中的url 是 http://t.cn/xxxxxxx  t.cn是其域名 ,其后面跟着的是7位算出来的字符串。
方法一:使用哈希库自定义算法

因为文本中显示太长的url会比较乱,或者采用省略显示的方式,或者采用短url的方式.

为了同时方便统计点击数以及进行内容过滤.实现了一个生成短url值的方法.

为了防止你的hash值被破解,可以在生成md5值的时候加入你自己的salt.

这样即便直到你的code_map也不能破解到原始url了.

为了让结果更加随机,把每次循环没有使用的第二个bit保存到e里面.这样可以让结果冲突率更小.

#引入哈希库
import hashlib 
    
def get_md5(s): 
  s = s.encode('utf8') if isinstance(s, unicode) else s 
  m = hashlib.md5() 
  m.update(s) 
  return m.hexdigest() 
    
code_map = ( 
      'a' , 'b' , 'c' , 'd' , 'e' , 'f' , 'g' , 'h' , 
      'i' , 'j' , 'k' , 'l' , 'm' , 'n' , 'o' , 'p' , 
      'q' , 'r' , 's' , 't' , 'u' , 'v' , 'w' , 'x' , 
      'y' , 'z' , '0' , '1' , '2' , '3' , '4' , '5' , 
      '6' , '7' , '8' , '9' , 'A' , 'B' , 'C' , 'D' , 
      'E' , 'F' , 'G' , 'H' , 'I' , 'J' , 'K' , 'L' , 
      'M' , 'N' , 'O' , 'P' , 'Q' , 'R' , 'S' , 'T' , 
      'U' , 'V' , 'W' , 'X' , 'Y' , 'Z'
      ) 
    
    
def get_hash_key(long_url): 
  hkeys = [] 
  hex = get_md5(long_url) 
  for i in xrange(0, 4): 
    n = int(hex[i*8:(i+1)*8], 16) 
    v = [] 
    e = 0
    for j in xrange(0, 5): 
      x = 0x0000003D & n 
      e |= ((0x00000002 & n ) >> 1) << j 
      v.insert(0, code_map[x]) 
      n = n >> 6
    e |= n << 5
    v.insert(0, code_map[e & 0x0000003D]) 
    hkeys.append(''.join(v)) 
  return hkeys 
    
if __name__ == '__main__': 
  print get_hash_key('http://www.pythontab.com')

方法二:使用libsurl库

libsurl 是一个用来生成短URL的C和Python库,支持 bit.ly 和 tinyurl 等短url 服务网站。

Python 相关文章推荐
python 创建弹出式菜单的实现代码
Jul 11 Python
python3 实现验证码图片切割的方法
Dec 07 Python
Django 日志配置按日期滚动的方法
Jan 31 Python
对python:threading.Thread类的使用方法详解
Jan 31 Python
利用selenium爬虫抓取数据的基础教程
Jun 10 Python
pyqt5 删除layout中的所有widget方法
Jun 25 Python
Python3+PyInstall+Sciter解决报错缺少dll、html等文件问题
Jul 15 Python
PyQt5中QTableWidget如何弹出菜单的示例代码
Feb 23 Python
浅析Python 抽象工厂模式的优缺点
Jul 13 Python
Lombok插件安装(IDEA)及配置jar包使用详解
Nov 04 Python
OpenCV全景图像拼接的实现示例
Jun 05 Python
总结几个非常实用的Python库
Jun 26 Python
python实现bucket排序算法实例分析
May 04 #Python
python在指定目录下查找gif文件的方法
May 04 #Python
python创建关联数组(字典)的方法
May 04 #Python
python对html代码进行escape编码的方法
May 04 #Python
python访问类中docstring注释的实现方法
May 04 #Python
Python编写生成验证码的脚本的教程
May 04 #Python
使用Python制作获取网站目录的图形化程序
May 04 #Python
You might like
两个强悍的php 图像处理类1
2009/06/15 PHP
PHP mail()函数使用及配置方法
2014/01/14 PHP
PHP内存缓存功能memcached示例
2016/10/19 PHP
Confirmer JQuery确认对话框组件
2010/06/09 Javascript
jQuery插件StickUp实现网页导航置顶
2015/04/12 Javascript
JavaScript实现MIPS乘法模拟的方法
2015/04/17 Javascript
jQuery封装的tab选项卡插件分享
2015/06/16 Javascript
js实现带缓冲效果的仿QQ面板折叠菜单代码
2015/09/06 Javascript
javascript正则表达式定义(语法)总结
2016/01/08 Javascript
基于Vue2的移动端开发环境搭建详解
2016/11/03 Javascript
详解Javascript百度地图接口开发文档中的类和方法
2017/02/07 Javascript
使用jQuery实现动态添加小广告
2017/07/11 jQuery
javascript高仿热血传奇游戏实现代码
2018/02/22 Javascript
jQuery实现的自定义轮播图功能详解
2018/12/28 jQuery
浅析JS中NEW的实现原理及重写
2020/02/20 Javascript
[00:56]2014DOTA2国际邀请赛 DK、iG 赛前探访
2014/07/10 DOTA
介绍Python中的fabs()方法的使用
2015/05/14 Python
Python基于Tkinter实现的记事本实例
2015/06/17 Python
Python中list列表的一些进阶使用方法介绍
2015/08/15 Python
基于windows下pip安装python模块时报错总结
2018/06/12 Python
Tensorflow使用tfrecord输入数据格式
2018/06/19 Python
PyTorch搭建一维线性回归模型(二)
2019/05/22 Python
kafka-python 获取topic lag值方式
2019/12/23 Python
使用Django和Postgres进行全文搜索的实例代码
2020/02/13 Python
Python调用接口合并Excel表代码实例
2020/03/31 Python
使用python创建生成动态链接库dll的方法
2020/05/09 Python
selenium携带cookies模拟登陆CSDN的实现
2021/01/19 Python
美国当红的名品折扣网:Gilt Groupe
2016/08/15 全球购物
上海方立数码笔试题
2013/10/18 面试题
小学开学标语
2014/07/01 职场文书
国际会计专业求职信
2014/08/04 职场文书
我们的节日春节活动方案
2014/08/22 职场文书
女性励志书籍推荐
2019/08/19 职场文书
JavaScript实现显示和隐藏图片
2021/04/29 Javascript
清空 Oracle 安装记录并重新安装
2022/04/26 Oracle
详解Anyscript开发指南绕过typescript类型检查
2022/09/23 Javascript