python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
python的绘图工具matplotlib使用实例
Jul 03 Python
在Python中使用模块的教程
Apr 27 Python
python链接Oracle数据库的方法
Jun 28 Python
Python 使用SMTP发送邮件的代码小结
Sep 21 Python
python3安装speech语音模块的方法
Dec 24 Python
python 反编译exe文件为py文件的实例代码
Jun 27 Python
python并发编程 Process对象的其他属性方法join方法详解
Aug 20 Python
Tensorflow 多线程设置方式
Feb 06 Python
python函数map()和partial()的知识点总结
May 26 Python
简述python Scrapy框架
Aug 17 Python
使用python把xmind转换成excel测试用例的实现代码
Oct 12 Python
关于的python五子棋的算法
May 02 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
PHP - Html Transfer Code
2006/10/09 PHP
php 目录与文件处理-郑阿奇(续)
2011/07/04 PHP
PHP中的正则表达式函数介绍
2012/02/27 PHP
php获取QQ头像并显示的方法
2014/12/23 PHP
PHP语法小结之基础和变量
2015/11/22 PHP
PHP根据key删除数组中指定的元素
2019/02/28 PHP
Safari5中alert的无限循环BUG
2011/04/07 Javascript
使用js+jquery实现无限极联动
2013/05/23 Javascript
JavaScript获取网页中第一个链接ID的方法
2015/04/03 Javascript
JS组件Bootstrap实现弹出框和提示框效果代码
2015/12/08 Javascript
JavaScript数据类型学习笔记分享
2016/09/01 Javascript
微信小程序 倒计时组件实现代码
2016/10/24 Javascript
JQuery页面随滚动条动态加载效果的简单实现(推荐)
2017/02/08 Javascript
详解webpack介绍&amp;安装&amp;常用命令
2017/06/29 Javascript
vue-cli的build的文件夹下没有dev-server.js文件配置mock数据的方法
2019/04/17 Javascript
在mpvue框架中使用Vant WeappUI组件库的注意事项【推进】
2019/06/09 Javascript
Vue v-for中的 input 或 select的值发生改变时触发事件操作
2020/08/31 Javascript
electron踩坑之remote of undefined的解决
2020/10/06 Javascript
node.js通过Sequelize 连接MySQL的方法
2020/12/28 Javascript
[54:47]Liquid vs VP Supermajor决赛 BO 第五场 6.10
2018/07/05 DOTA
[03:00]DOTA2-DPC中国联赛1月18日Recap集锦
2021/03/11 DOTA
Python中使用PIL库实现图片高斯模糊实例
2015/02/08 Python
Python使用xlwt模块操作Excel的方法详解
2018/03/27 Python
Python进程间通信Queue消息队列用法分析
2019/05/22 Python
HTML5 Canvas实现360度全景图的示例代码
2018/01/29 HTML / CSS
6号汽车旅馆预订:Motel 6
2018/02/11 全球购物
FC-Moto西班牙:摩托车手最大的购物场所之一
2019/04/11 全球购物
香港中原电器网上商店:Chung Yuen
2019/06/26 全球购物
大学生毕业自荐信
2013/10/10 职场文书
我的网上商城创业计划书
2013/12/26 职场文书
应届毕业生个人求职信范文
2014/01/29 职场文书
小学优秀教育工作者事迹材料
2014/05/09 职场文书
会计求职简历自我评价
2015/03/10 职场文书
2015年前台个人工作总结
2015/04/03 职场文书
运动会100米广播稿
2015/08/19 职场文书
Vue ECharts实现机舱座位选择展示功能
2022/05/15 Vue.js