python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
Windows下安装python2.7及科学计算套装
Mar 05 Python
python检测远程udp端口是否打开的方法
Mar 14 Python
在Heroku云平台上部署Python的Django框架的教程
Apr 20 Python
在Python中操作列表之List.pop()方法的使用
May 21 Python
通过实例浅析Python对比C语言的编程思想差异
Aug 30 Python
详解python 注释、变量、类型
Aug 10 Python
python GUI图形化编程wxpython的使用
Jul 19 Python
Python字典中的值为列表或字典的构造实例
Dec 16 Python
利用 PyCharm 实现本地代码和远端的实时同步功能
Mar 23 Python
解决Jupyter NoteBook输出的图表太小看不清问题
Apr 16 Python
Python 基于jwt实现认证机制流程解析
Jun 22 Python
Python pyecharts案例超市4年数据可视化分析
Aug 14 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
用来给图片加水印的PHP类
2008/04/09 PHP
PHP获取指定函数定义在哪个文件中以及其所在的行号实例
2014/05/08 PHP
php的慢速日志引起的Mysql错误问题分析
2014/05/13 PHP
ThinkPHP框架整合微信支付之刷卡模式图文详解
2019/04/10 PHP
javascript getElementsByClassName 和js取地址栏参数
2010/01/02 Javascript
基于MooTools的很有创意的滚动条时钟动画
2010/11/14 Javascript
IE下通过a实现location.href 获取referer的值
2014/09/04 Javascript
深入理解JavaScript系列(41):设计模式之模板方法详解
2015/03/04 Javascript
jquery+ajax+text文本框实现智能提示完整实例
2016/07/09 Javascript
require.js+vue开发微信上传图片组件
2016/10/27 Javascript
微信小程序 网络API 上传、下载详解
2016/11/09 Javascript
JS正则表达式验证密码格式的集中情况总结
2017/02/23 Javascript
JS实现上传图片实时预览功能
2017/05/22 Javascript
Js实现京东无延迟菜单效果实例(demo)
2017/06/02 Javascript
微信小程序 sha1 实现密码加密实例详解
2017/07/06 Javascript
Bootstrap table使用方法记录
2017/08/23 Javascript
Vue 实现从文件中获取文本信息的方法详解
2019/10/16 Javascript
js仿京东放大镜效果
2020/08/09 Javascript
[49:31]DOTA2-DPC中国联赛 正赛 Elephant vs LBZS BO3 第二场 1月29日
2021/03/11 DOTA
Python实现OpenCV的安装与使用示例
2018/03/30 Python
使用python将图片格式转换为ico格式的示例
2018/10/22 Python
对python读取CT医学图像的实例详解
2019/01/24 Python
python爬虫模拟浏览器访问-User-Agent过程解析
2019/12/28 Python
浅谈Python中range与Numpy中arange的比较
2020/03/11 Python
Python爬虫之Selenium实现关闭浏览器
2020/12/04 Python
HTML5 Canvas 起步(1) - 基本概念
2009/05/12 HTML / CSS
REN Clean Skincare官网:英国本土有机护肤品牌
2019/02/23 全球购物
视图的作用
2014/12/19 面试题
什么是数据库锁?Oracle中都有哪些类型的锁?
2015/08/21 面试题
StringBuilder和String的区别
2015/05/18 面试题
实习生自荐信范文分享
2013/11/27 职场文书
幼儿园优秀班主任事迹材料
2014/05/14 职场文书
普通党员个人整改措施
2014/10/27 职场文书
2014年老干部工作总结
2014/11/21 职场文书
事业单位个人总结
2015/02/12 职场文书
golang三种设计模式之简单工厂、方法工厂和抽象工厂
2022/04/10 Golang