python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
tensorflow实现图像的裁剪和填充方法
Jul 27 Python
PyCharm设置护眼背景色的方法
Oct 29 Python
解决Pycharm下面出现No R interpreter defined的问题
Oct 29 Python
Python并发:多线程与多进程的详解
Jan 24 Python
PyQt5 多窗口连接实例
Jun 19 Python
Python正则表达式匹配数字和小数的方法
Jul 03 Python
python应用文件读取与登录注册功能
Sep 23 Python
解决Python中回文数和质数的问题
Nov 24 Python
Pycharm 安装 idea VIM插件的图文教程详解
Feb 21 Python
Python 窗体(tkinter)下拉列表框(Combobox)实例
Mar 04 Python
基于python实现把json数据转换成Excel表格
May 07 Python
python中turtle库的简单使用教程
Nov 11 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
MVC模式的PHP实现
2006/10/09 PHP
php debug 安装技巧
2011/04/30 PHP
探讨php中遍历二维数组的几种方法详解
2013/06/08 PHP
Javascript 学习书 推荐
2009/06/13 Javascript
js 匿名调用实现代码
2009/06/19 Javascript
ExtJS的FieldSet的column列布局
2009/11/20 Javascript
DWZ table的原生分页浅谈
2013/03/01 Javascript
基于javascript滚动图片具体实现
2013/11/18 Javascript
js动态添加删除,后台取数据(示例代码)
2013/11/25 Javascript
JavaScript实现将数组中所有元素连接成一个字符串的方法
2015/04/06 Javascript
原生js和jquery实现图片轮播淡入淡出效果
2015/04/23 Javascript
学JavaScript七大注意事项【必看】
2016/05/04 Javascript
Node.js中常规的文件操作总结
2016/10/13 Javascript
基于Bootstrap的网页设计实例
2017/03/01 Javascript
BootStrap数据表格实例代码
2017/09/13 Javascript
vue、react等单页面项目部署到服务器的方法及vue和react的区别
2018/09/29 Javascript
ES7之Async/await的使用详解
2019/03/28 Javascript
10个最受欢迎的 JavaScript框架(推荐)
2019/04/24 Javascript
[35:39]完美世界DOTA2联赛PWL S2 FTD.C vs Rebirth 第二场 11.22
2020/11/24 DOTA
Python中matplotlib中文乱码解决办法
2017/05/12 Python
Python实现PS滤镜碎片特效功能示例
2018/01/24 Python
对pycharm代码整体左移和右移缩进快捷键的介绍
2018/07/16 Python
详解Django中间件的5种自定义方法
2018/07/26 Python
python画一个玫瑰和一个爱心
2020/08/18 Python
对python中Json与object转化的方法详解
2018/12/31 Python
pytorch实现从本地加载 .pth 格式模型
2020/02/14 Python
CSS3 box-sizing属性
2009/04/17 HTML / CSS
解释下列WebService名词:WSDL、SOAP、UDDI
2012/06/22 面试题
工程造价与财务管理专业应届生求职信
2013/10/06 职场文书
公司中层干部的自我评价分享
2014/03/01 职场文书
我的教育故事演讲稿
2014/05/04 职场文书
债务纠纷委托书
2014/08/30 职场文书
师范生小学见习总结
2015/06/23 职场文书
2015年“我们的节日·重阳节”活动总结
2015/07/29 职场文书
工作后的感想
2015/08/07 职场文书
Java面试题冲刺第十八天--Spring框架3
2021/08/07 面试题