python实现html转ubb代码(html2ubb)


Posted in Python onJuly 03, 2014

这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。

import re
def Html2UBB(content):
	#以下是将html标签转为ubb标签
	pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
	content = pattern.sub(r'[url=1]2[/url]',content)
	pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
	content = pattern.sub(r'[img]1[/img]',content)
	pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
	content = pattern.sub(r'[b]1[/b]',content)
	pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
	content = pattern.sub(r'[1]2[/1]',content)
	pattern = re.compile( '<[^>]*?>',re.I)
	content = pattern.sub('',content)
	#以下是将html转义字符转为普通字符
	content = content.replace('<','<')
	content = content.replace('>','>')
	content = content.replace('”','”')
	content = content.replace('“','“')
	content = content.replace('"','"')
	content = content.replace('©','©')
	content = content.replace('®','®')
	content = content.replace(' ',' ')
	content = content.replace('—','—')
	content = content.replace('–','?')
	content = content.replace('‹','‹')
	content = content.replace('›','›')
	content = content.replace('…','…')
	content = content.replace('&','&')
	return content

使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb

Python 相关文章推荐
在Python中处理字符串之isdigit()方法的使用
May 18 Python
Python复制文件操作实例详解
Nov 10 Python
Python的IDEL增加清屏功能实例
Jun 19 Python
Python函数式编程
Jul 20 Python
python提取图像的名字*.jpg到txt文本的方法
May 10 Python
python删除文本中行数标签的方法
May 31 Python
python+selenium实现QQ邮箱自动发送功能
Jan 23 Python
详解python持久化文件读写
Apr 06 Python
对Django外键关系的描述
Jul 26 Python
解决Python使用列表副本的问题
Dec 19 Python
简单了解Django项目应用创建过程
Jul 06 Python
Python json解析库jsonpath原理及使用示例
Nov 25 Python
Python 获取新浪微博的最新公共微博实例分享
Jul 03 #Python
python socket 超时设置 errno 10054
Jul 01 #Python
python设置检查点简单实现代码
Jul 01 #Python
如何搜索查找并解决Django相关的问题
Jun 30 #Python
python字典多条件排序方法实例
Jun 30 #Python
python实现的解析crontab配置文件代码
Jun 30 #Python
全面解读Python Web开发框架Django
Jun 30 #Python
You might like
造就帕卡马拉的帕卡斯是怎么被发现的
2021/03/03 咖啡文化
用PHP实现的生成静态HTML速度快类库
2007/03/31 PHP
PHP数组遍历知识汇总(包含遍历方法、数组指针操作函数、数组遍历测速)
2014/07/05 PHP
php数组函数array_key_exists()小结
2015/12/10 PHP
php实现产品加入购物车功能(1)
2020/07/23 PHP
PHP实现打包zip并下载功能
2018/06/12 PHP
关于在IE下的一个安全BUG --可用于跟踪用户的系统鼠标位置
2013/04/17 Javascript
判断javascript的数据类型(示例代码)
2013/12/11 Javascript
jquery幻灯片插件bxslider样式改进实例
2014/10/15 Javascript
浅谈jquery中delegate()与live()
2015/06/22 Javascript
CSS3实现动态背景登录框的代码
2015/07/28 Javascript
使用jQuery获取data-的自定义属性
2015/11/10 Javascript
jQuery+ajax的资源回收处理机制分析
2017/01/07 Javascript
初探nodeJS
2017/01/24 NodeJs
正则 js分转元带千分符号详解
2017/03/08 Javascript
Vue实现百度下拉提示搜索功能
2017/06/21 Javascript
详解Angular6学习笔记之主从组件
2018/09/05 Javascript
ExtJs使用自定义插件动态保存表头配置(隐藏或显示)
2018/09/25 Javascript
通过js示例讲解时间复杂度与空间复杂度
2019/08/06 Javascript
vue实现登录、注册、退出、跳转等功能
2020/12/23 Vue.js
Python语言的12个基础知识点小结
2014/07/10 Python
Python的迭代器和生成器使用实例
2015/01/14 Python
python自定义时钟类、定时任务类
2021/02/22 Python
python爬虫 基于requests模块的get请求实现详解
2019/08/20 Python
Python 爬虫实现增加播客访问量的方法实现
2019/10/31 Python
pytorch torchvision.ImageFolder的用法介绍
2020/02/20 Python
HTML5 weui使用笔记
2019/11/21 HTML / CSS
廉价连衣裙和婚纱礼服在线销售:Tbdress
2019/02/28 全球购物
创立科技Java面试题
2015/11/29 面试题
实习自荐信
2013/10/13 职场文书
文秘自荐信
2013/10/20 职场文书
教师党员公开承诺事项
2014/05/28 职场文书
对照四风自我剖析材料
2014/10/07 职场文书
教师节寄语2015
2015/03/23 职场文书
Go语言实现Snowflake雪花算法
2021/06/08 Golang
python字典的元素访问实例详解
2021/07/21 Python