python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
在Python中使用dict和set方法的教程
Apr 27 Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 Python
Django教程笔记之中间件middleware详解
Aug 01 Python
python无限生成不重复(字母,数字,字符)组合的方法
Dec 04 Python
Python解析、提取url关键字的实例详解
Dec 17 Python
python多任务及返回值的处理方法
Jan 22 Python
python 数据提取及拆分的实现代码
Aug 26 Python
关于python中plt.hist参数的使用详解
Nov 28 Python
python自动脚本的pyautogui入门学习
Apr 01 Python
python传到前端的数据,双引号被转义的问题
Apr 03 Python
Python如何读取、写入CSV数据
Jul 28 Python
python 调用js的四种方式
Apr 11 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
php遍历文件夹所有文件子文件夹函数代码
2013/11/27 PHP
PHP实现生成唯一编号(36进制的不重复编号)
2014/07/01 PHP
php获取远程文件的内容和大小
2015/11/03 PHP
thinkPHP5 tablib标签库自定义方法详解
2017/05/10 PHP
在laravel中使用Symfony的Crawler组件分析HTML
2017/06/19 PHP
PHP实现的MD5结合RSA签名算法实例
2017/10/07 PHP
基于jquery的Repeater实现代码
2010/07/17 Javascript
js整数字符串转换为金额类型数据(示例代码)
2013/12/26 Javascript
jquery.idTabs 选项卡使用示例代码
2014/09/03 Javascript
Vue数据驱动模拟实现4
2017/01/12 Javascript
ES6中Symbol类型用法实例详解
2017/04/06 Javascript
Angularjs中ng-repeat的简单实例
2017/08/25 Javascript
jquery中有哪些api jQuery主要API
2017/11/20 jQuery
产制造追溯系统之通过微信小程序实现移动端报表平台
2019/06/03 Javascript
微信小程序实现点击卡片 翻转效果
2019/09/04 Javascript
Node.js操作MongoDB数据库实例分析
2020/01/19 Javascript
node.js 微信开发之定时获取access_token
2020/02/07 Javascript
Element Input输入框的使用方法
2020/07/26 Javascript
Python中map和列表推导效率比较实例分析
2015/06/17 Python
Python中矩阵创建和矩阵运算方法
2018/08/04 Python
python3.4 将16进制转成字符串的实例
2019/06/12 Python
python挖矿算力测试程序详解
2019/07/03 Python
python 实现识别图片上的数字
2019/07/30 Python
TensorFlow2.X使用图片制作简单的数据集训练模型
2020/04/08 Python
Keras:Unet网络实现多类语义分割方式
2020/06/11 Python
python 实现弹球游戏的示例代码
2020/11/17 Python
HTML5+WebSocket实现多文件同时上传的实例
2016/12/29 HTML / CSS
意大利专业化妆品品牌:KIKO MILANO
2017/02/01 全球购物
美国木工工具和用品商店:Woodcraft
2019/10/30 全球购物
自行车租赁公司创业计划书
2014/01/28 职场文书
电气自动化专业职业规划范文
2014/02/16 职场文书
《火烧云》教学反思
2016/02/23 职场文书
好段摘抄大全(48句)
2019/08/08 职场文书
Python打包为exe详细教程
2021/05/18 Python
Python字典的基础操作
2021/11/01 Python
MySQL日期时间函数知识汇总
2022/03/17 MySQL