python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
Python实现多线程HTTP下载器示例
Feb 11 Python
Python中元组,列表,字典的区别
May 21 Python
Python之Scrapy爬虫框架安装及使用详解
Nov 16 Python
Python爬虫设置代理IP的方法(爬虫技巧)
Mar 04 Python
Python模拟登录的多种方法(四种)
Jun 01 Python
python 将json数据提取转化为txt的方法
Oct 26 Python
详解python:time模块用法
Mar 25 Python
检测tensorflow是否使用gpu进行计算的方式
Feb 03 Python
使用sklearn对多分类的每个类别进行指标评价操作
Jun 11 Python
Pytorch框架实现mnist手写库识别(与tensorflow对比)
Jul 20 Python
python 制作网站筛选工具(附源码)
Jan 21 Python
python opencv通过按键采集图片源码
May 20 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
转生史莱姆:萌王第一次撸串开心到飞起,哥布塔撸串却神似界王神
2018/11/30 日漫
PHP写的获取各搜索蜘蛛爬行记录代码
2012/08/21 PHP
php控制linux服务器常用功能 关机 重启 开新站点等
2012/09/05 PHP
PHP微信开发用Cache 解决数据缓存
2016/07/11 PHP
利用javascript中的call实现继承
2007/01/22 Javascript
爱恋千雪-US-AscII加密解密工具(网页加密)下载
2007/06/06 Javascript
Ext.FormPanel 提交和 Ext.Ajax.request 异步提交函数的区别
2009/11/12 Javascript
javascript正则表达式中参数g(全局)的作用
2010/11/11 Javascript
jquery 查找select ,并触发事件的实现代码
2011/03/30 Javascript
JQUERY 获取IFrame中对象及获取其父窗口中对象示例
2013/08/19 Javascript
纯Javascript实现ping功能的方法
2015/03/20 Javascript
js实现简洁的TAB滑动门效果代码
2015/09/06 Javascript
学习JavaScript设计模式之观察者模式
2020/04/22 Javascript
手机Web APP如何实现分享多平台功能
2016/08/19 Javascript
Centos6.8下Node.js安装教程
2017/05/12 Javascript
vue实现密码显示与隐藏按钮的自定义组件功能
2019/04/23 Javascript
javascript面向对象程序设计实践常用知识点总结
2019/07/29 Javascript
解决layui下拉框监听问题(监听不到值的变化)
2019/09/28 Javascript
Vue自定义多选组件使用详解
2020/09/08 Javascript
Python的另外几种语言实现
2015/01/29 Python
python文件拆分与重组实例
2018/12/10 Python
django解决订单并发问题【推荐】
2019/07/31 Python
Django中使用session保持用户登陆连接的例子
2019/08/06 Python
Python简易版停车管理系统
2019/08/12 Python
Python pymysql模块安装并操作过程解析
2020/10/13 Python
matplotlib教程——强大的python作图工具库
2020/10/15 Python
担保书格式及范文
2014/04/01 职场文书
服务理念标语
2014/06/18 职场文书
高一学年自我鉴定范文(3篇)
2014/09/26 职场文书
旅游局领导班子“四风”问题对照检查材料思想汇报
2014/09/29 职场文书
工作保证书
2015/01/17 职场文书
妈妈再爱我一次观后感
2015/06/08 职场文书
永不妥协观后感
2015/06/10 职场文书
小学家庭教育心得体会
2016/01/14 职场文书
Python获取百度热搜的完整代码
2021/04/07 Python
python自动化测试通过日志3分钟定位bug
2021/11/20 Python