python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
用Python的urllib库提交WEB表单
Feb 24 Python
python实现DNS正向查询、反向查询的例子
Apr 25 Python
python实现可将字符转换成大写的tcp服务器实例
Apr 29 Python
Python ftp上传文件
Feb 13 Python
关于numpy中np.nonzero()函数用法的详解
Feb 07 Python
python使用fcntl模块实现程序加锁功能示例
Jun 23 Python
Django中多种重定向方法使用详解
Jul 17 Python
关于Python内存分配时的小秘密分享
Sep 05 Python
基于python中__add__函数的用法
Nov 25 Python
pytorch 状态字典:state_dict使用详解
Jan 17 Python
Django如何使用redis作为缓存
May 21 Python
Django mysqlclient安装和使用详解
Sep 17 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
PHP pathinfo()获得文件的路径、名称等信息说明
2011/09/13 PHP
php获取服务器信息的实现代码
2013/02/04 PHP
php模拟post提交数据的方法
2015/02/12 PHP
PHP编写文件多服务器同步程序
2016/07/02 PHP
php获取flash尺寸详细数据的方法
2016/11/12 PHP
jQuery文件上传插件Uploadify使用指南
2014/06/05 Javascript
javascript实现全角转半角的方法
2016/01/23 Javascript
浅析jQuery事件之on()方法绑定多个选择器,多个事件
2016/04/27 Javascript
Javascript函数中的arguments.callee用法实例分析
2016/09/16 Javascript
Web 开发中Ajax的Session 超时处理方法
2017/01/19 Javascript
AngularJS路由实现页面跳转实例
2017/03/03 Javascript
3分钟快速搭建nodejs本地服务器方法运行测试html/js
2017/04/01 NodeJs
React入门教程之Hello World以及环境搭建详解
2017/07/11 Javascript
详解win7 cmd执行vue不是内部命令的解决方法
2017/07/27 Javascript
vue jsx 使用指南及vue.js 使用jsx语法的方法
2017/11/11 Javascript
nodejs+express搭建多人聊天室步骤
2018/02/12 NodeJs
jQuery实现监听下拉框选中内容发生改变操作示例
2018/07/13 jQuery
ElementUI radio组件选中小改造
2019/08/12 Javascript
[02:16]深扒TI7聊天轮盘语音出处2
2017/05/11 DOTA
深入解析Python编程中super关键字的用法
2016/06/24 Python
python数据结构之列表和元组的详解
2017/09/23 Python
Python中类的创建和实例化操作示例
2019/02/27 Python
numpy:找到指定元素的索引示例
2019/11/26 Python
如何解决pycharm调试报错的问题
2020/08/06 Python
UI自动化定位常用实现方法代码示例
2020/10/27 Python
html5 利用重力感应实现摇一摇换颜色可用来做抽奖等等
2014/05/07 HTML / CSS
海外淘书首选:AbeBooks
2017/07/31 全球购物
《雷雨》教学反思
2014/02/20 职场文书
军训感想500字
2014/02/20 职场文书
汉语言文学毕业生自荐信范文
2014/03/24 职场文书
养成教育经验材料
2014/05/26 职场文书
2014年教育实习工作总结
2014/11/22 职场文书
工作失职检讨书范文
2015/05/05 职场文书
MySQL 分组查询的优化方法
2021/05/12 MySQL
Win11更新失败并提示0xc1900101
2022/04/19 数码科技
移除Selenium中window.navigator.webdriver值
2022/06/10 Python