python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
python端口扫描系统实现方法
Nov 19 Python
Python实现拼接多张图片的方法
Dec 01 Python
由浅入深讲解python中的yield与generator
Apr 05 Python
python实现从文件中读取数据并绘制成 x y 轴图形的方法
Oct 14 Python
python实现将汉字保存成文本的方法
Nov 16 Python
使用Python的SymPy库解决数学运算问题的方法
Mar 27 Python
python3.7 利用函数os pandas利用excel对文件名进行归类
Sep 29 Python
python3.8下载及安装步骤详解
Jan 15 Python
Python matplotlib修改默认字体的操作
Mar 05 Python
Python实现井字棋小游戏
Mar 09 Python
keras 指定程序在某块卡上训练实例
Jun 22 Python
scrapy框架携带cookie访问淘宝购物车功能的实现代码
Jul 07 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
十大感人催泪爱情动漫 第一名至今不忍在看第二遍
2020/03/04 日漫
PHP生成不重复标识符的方法
2014/11/21 PHP
php的debug相关函数用法示例
2016/07/11 PHP
php curl批处理实现可控并发异步操作示例
2018/05/09 PHP
laravel5.1框架基础之Blade模板继承简单使用方法分析
2019/09/05 PHP
让您的菜单不离网站
2006/10/03 Javascript
兼容多浏览器的iframe自适应高度(ie8 、谷歌浏览器4.0和 firefox3.5.3)
2009/11/04 Javascript
精通Javascript系列之数值计算
2011/06/07 Javascript
jQuery获取选中内容及设置元素属性的方法
2014/07/09 Javascript
JS的框架Polymer中的dom-if和is属性使用说明
2015/07/29 Javascript
js图片上传前预览功能(兼容所有浏览器)
2016/08/24 Javascript
DataTables+BootStrap组合使用Ajax来获取数据并且动态加载dom的方法(排序,过滤,分页等)
2016/11/09 Javascript
Vue.js学习教程之列表渲染详解
2017/05/17 Javascript
Angular4 中常用的指令入门总结
2017/06/12 Javascript
JavaScript实现瀑布流图片效果
2017/06/30 Javascript
NodeJS 实现多语言的示例代码
2018/09/11 NodeJs
electron实现qq快捷登录的方法示例
2018/10/22 Javascript
详解vue-cli+es6引入es5写的js(两种方法)
2019/04/19 Javascript
webpack 处理CSS资源的实现
2019/09/27 Javascript
微信小程序 textarea 层级过高问题简单解决方案
2019/10/14 Javascript
javascript中contains是否包含功能实现代码(扩展字符、数组、dom)
2020/04/07 Javascript
[02:15]2014DOTA2国际邀请赛 专访LGD.lin小兔子是大腿
2014/07/14 DOTA
初步介绍Python中的pydoc模块和distutils模块
2015/04/13 Python
python 简单搭建阻塞式单进程,多进程,多线程服务的实例
2017/11/01 Python
python的numpy模块安装不成功简单解决方法总结
2017/12/23 Python
python自动化测试之异常及日志操作实例分析
2019/11/09 Python
Python基于Serializer实现字段验证及序列化
2020/11/04 Python
新浪网技术部笔试题
2016/08/26 面试题
2019年Java 最常见的 面试题
2016/10/19 面试题
为什么需要版本控制
2016/10/28 面试题
英文简历中的自我评价用语
2013/12/09 职场文书
大学生优秀团员事迹材料
2014/01/30 职场文书
财政专业求职信范文
2014/02/19 职场文书
《去年的树》教学反思
2014/04/11 职场文书
优秀党员学习焦裕禄精神思想汇报范文
2014/09/10 职场文书
清洁工工作总结
2015/08/11 职场文书