python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
Python操作mysql数据库实现增删查改功能的方法
Jan 15 Python
django在接受post请求时显示403forbidden实例解析
Jan 25 Python
Opencv+Python 色彩通道拆分及合并的示例
Dec 08 Python
详解Python:面向对象编程
Apr 10 Python
Python安装与基本数据类型教程详解
May 29 Python
django 基于中间件实现限制ip频繁访问过程详解
Jul 30 Python
PyTorch中Tensor的拼接与拆分的实现
Aug 18 Python
Python 简单计算要求形状面积的实例
Jan 18 Python
Python 定义只读属性的实现方式
Mar 05 Python
python轮询机制控制led实例
May 03 Python
解决echarts中饼图标签重叠的问题
May 16 Python
VSCode中autopep8无法运行问题解决方案(提示Error: Command failed,usage)
Mar 02 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
BBS(php &amp; mysql)完整版(七)
2006/10/09 PHP
落伍首发 php+mysql 采用ajax技术的 省 市 地 3级联动无刷新菜单 源码
2006/12/16 PHP
简单谈谈favicon
2015/06/10 PHP
php输出图像的方法实例分析
2017/02/16 PHP
web页面数据展示新想法(json)
2010/06/08 Javascript
在图片上显示左右箭头类似翻页的代码
2013/03/04 Javascript
js获取url参数值的两种方式
2013/09/10 Javascript
多种方法实现load加载完成后把图片一次性显示出来
2014/02/19 Javascript
纯javascript实现简单下拉刷新功能
2015/03/13 Javascript
JS表格组件神器bootstrap table详解(基础版)
2015/12/08 Javascript
基于canvas实现的绚丽圆圈效果完整实例
2016/01/26 Javascript
基于JavaScript实现瀑布流效果(循环渐近)
2016/01/27 Javascript
jQuery的 $.ajax防止重复提交的两种方法(推荐)
2016/10/14 Javascript
JS监控关闭浏览器操作的实例详解
2017/09/12 Javascript
vue系列之requireJs中引入vue-router的方法
2018/07/18 Javascript
使用vue.js在页面内组件监听scroll事件的方法
2018/09/11 Javascript
Vue.js上传图片到阿里云OSS存储的方法示例
2018/12/13 Javascript
[01:12]DOTA2次级职业联赛 - Newbee.Y 战队宣传片
2014/12/01 DOTA
[01:17]炒鸡美酒第四天TA暴走
2018/06/05 DOTA
[30:37]【全国守擂赛】第三周擂主赛 Dark Knight vs. Leopard Gaming
2020/05/04 DOTA
Django中更新多个对象数据与删除对象的方法
2015/07/17 Python
Django如何自定义model创建数据库索引的顺序
2019/06/20 Python
tensorflow 利用expand_dims和squeeze扩展和压缩tensor维度方式
2020/02/07 Python
通过自学python能找到工作吗
2020/06/21 Python
曼城官方网上商店:Manchester City
2019/09/10 全球购物
JAVA代码查错题
2014/10/10 面试题
世界经理人咨询有限公司面试
2014/09/23 面试题
顺丰快递Java软件工程师面试题
2015/07/31 面试题
毕业求职自荐信格式是什么
2013/11/19 职场文书
升旗仪式主持词
2014/03/19 职场文书
庆六一活动总结
2014/08/29 职场文书
上班迟到检讨书
2015/05/06 职场文书
vue-cropper组件实现图片切割上传
2021/05/27 Vue.js
QT连接MYSQL数据库的详细步骤
2021/07/07 MySQL
浅谈Redis的keys命令到底有多慢
2021/10/05 Redis
Pandas数据结构之Series的使用
2022/03/31 Python