python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
下载安装setuptool和pip linux安装pip    
Jan 24 Python
在Python的Django框架中包装视图函数
Jul 20 Python
Python 如何访问外围作用域中的变量
Sep 11 Python
Python简单删除列表中相同元素的方法示例
Jun 12 Python
python中的常量和变量代码详解
Jul 25 Python
python字典的遍历3种方法详解
Aug 10 Python
在Python中利用pickle保存变量的实例
Dec 30 Python
Python urlopen()和urlretrieve()用法解析
Jan 07 Python
基于Tensorflow:CPU性能分析
Feb 10 Python
解决django migrate报错ORA-02000: missing ALWAYS keyword
Jul 02 Python
python pygame 开发五子棋双人对弈
May 02 Python
Python如何利用pandas读取csv数据并绘图
Jul 07 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
我的论坛源代码(九)
2006/10/09 PHP
Blitz templates 最快的PHP模板引擎
2010/04/06 PHP
改写ThinkPHP的U方法使其路由下分页正常
2014/07/02 PHP
深入浅析php json 格式控制
2015/12/24 PHP
说明你的Javascript技术很烂的五个原因
2011/04/26 Javascript
javasctipt如何显示几分钟前、几天前等
2014/04/30 Javascript
浅谈javascript中call()、apply()、bind()的用法
2015/04/20 Javascript
jQuery插件boxScroll实现图片轮播特效
2015/07/14 Javascript
jQuery实现灰蓝风格标准二级下拉菜单效果代码
2015/08/31 Javascript
JS实现不使用图片仿Windows右键菜单效果代码
2015/10/22 Javascript
Javascript循环删除数组中元素的几种方法示例
2017/05/18 Javascript
浅谈JavaScript中的属性:如何遍历属性
2017/09/14 Javascript
基于JSONP原理解析(推荐)
2017/12/04 Javascript
Vue3 中的数据侦测的实现
2019/10/09 Javascript
JS实现商品橱窗特效
2020/01/09 Javascript
JS前后端实现身份证号验证代码解析
2020/07/23 Javascript
[59:53]DOTA2-DPC中国联赛 正赛 VG vs Elephant BO3 第二场 3月6日
2021/03/11 DOTA
Python time模块详解(常用函数实例讲解,非常好)
2014/04/24 Python
将Emacs打造成强大的Python代码编辑工具
2015/11/20 Python
人生苦短我用python python如何快速入门?
2018/03/12 Python
Python交互环境下实现输入代码
2018/06/22 Python
Python中垃圾回收和del语句详解
2018/11/15 Python
PyTorch的深度学习入门之PyTorch安装和配置
2019/06/27 Python
pygame实现贪吃蛇游戏(上)
2019/10/29 Python
python解析多层json操作示例
2019/12/30 Python
利用Python裁切tiff图像且读取tiff,shp文件的实例
2020/03/10 Python
python 两种方法修改文件的创建时间、修改时间、访问时间
2020/09/26 Python
python爬虫利用代理池更换IP的方法步骤
2021/02/21 Python
苏格兰销售女装、男装和童装的连锁店:M&Co
2018/03/16 全球购物
医学专业毕业生推荐信
2013/11/14 职场文书
委托书的写法
2014/09/16 职场文书
初中生散播谣言检讨书
2014/11/17 职场文书
五一劳动节活动总结
2015/02/09 职场文书
幼儿园推普周活动总结
2015/05/07 职场文书
医者仁心观后感
2015/06/17 职场文书
Java 数组的使用
2022/05/11 Java/Android