python处理“


Posted in Python onJune 10, 2019

python如何处理“&#”开头加数字的html字符,比如:风水这类数据。

用python抓取数据时,有时会遇到想要数据是以“&#”开头加数字的字符,比如图中所示的这些:

风水大术士

python处理“

python处理“

这些字符需要再次转换才能变回中文内容。这些字符需要再次转换才能变回中文内容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

python处理“

定义变量,再定义转换代码。

python处理“

代码中最重要的是“data_parser = HTMLParser.HTMLParser()”,通过此才能用“.unescape()”方法。 

python处理“

测试运行,这串字符串正常输出了中文。

python处理“

Python3.7+版本

在最新python版本中,不能用上面的导入方法。可以用"import html"或者“from html import unescape”。这里使用"import html"做测试。

python处理“

导入html后,直接用".unescape()"来处理字符串。

python处理“

运行后,正常转换成了中文字符。

python处理“

感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python学习笔记整理3之输入输出、python eval函数
Dec 14 Python
python将字典内容存入mysql实例代码
Jan 18 Python
python SMTP实现发送带附件电子邮件
May 22 Python
python 基于TCP协议的套接字编程详解
Jun 29 Python
python 实现创建文件夹和创建日志文件的方法
Jul 07 Python
Python namedtuple命名元组实现过程解析
Jan 08 Python
Pytorch 搭建分类回归神经网络并用GPU进行加速的例子
Jan 09 Python
python动态文本进度条的实例代码
Jan 22 Python
Python实现RabbitMQ6种消息模型的示例代码
Mar 30 Python
新手常见Python错误及异常解决处理方案
Jun 18 Python
一文读懂Python 枚举
Aug 25 Python
python分分钟绘制精美地图海报
Feb 15 Python
python-pyinstaller、打包后获取路径的实例
Jun 10 #Python
详解Python 切片语法
Jun 10 #Python
使用Python OpenCV为CNN增加图像样本的实现
Jun 10 #Python
Python 虚拟空间的使用代码详解
Jun 10 #Python
在Python中过滤Windows文件名中的非法字符方法
Jun 10 #Python
对Python 检查文件名是否规范的实例详解
Jun 10 #Python
java判断三位数的实例讲解
Jun 10 #Python
You might like
php 购物车实例(申精)
2009/05/11 PHP
100多行PHP代码实现socks5代理服务器[2]
2016/05/05 PHP
php二维码生成以及下载实现
2017/09/28 PHP
通过event对象的fromElement属性解决热区设置主实体的一个bug
2008/12/22 Javascript
Javascript的setTimeout()使用闭包特性时需要注意的问题
2014/09/23 Javascript
mvc中form表单提交的三种方式(推荐)
2016/08/10 Javascript
十大热门的JavaScript框架和库
2017/03/21 Javascript
vue2 前后端分离项目ajax跨域session问题解决方法
2017/04/27 Javascript
Angular 1.x个人使用的经验小结
2017/07/19 Javascript
微信小程序获取手机网络状态的方法【附源码下载】
2017/12/08 Javascript
js中document.write和document.writeln的区别
2018/03/11 Javascript
vue.js实现的全选与全不选功能示例【基于elementui】
2018/12/03 Javascript
如何解决.vue文件url引用文件的问题
2019/01/18 Javascript
vue-cli随机生成port源码的方法
2019/09/02 Javascript
[07:47]DOTA2国际邀请赛采访专栏:探访Valve总部
2013/08/08 DOTA
Python使用Socket(Https)Post登录百度的实现代码
2012/05/18 Python
Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法
2015/04/24 Python
win系统下为Python3.5安装flask-mongoengine 库
2016/12/20 Python
Python实现矩阵加法和乘法的方法分析
2017/12/19 Python
对pandas中时间窗函数rolling的使用详解
2018/11/28 Python
PyQt5下拉式复选框QComboCheckBox的实例
2019/06/25 Python
python实现多进程按序号批量修改文件名的方法示例
2019/12/30 Python
python实现吃苹果小游戏
2020/03/21 Python
python爬虫学习笔记之Beautifulsoup模块用法详解
2020/04/09 Python
Python自动化测试基础必备知识点总结
2021/02/07 Python
CSS3绘制六边形的简单实现
2016/08/25 HTML / CSS
东方电视购物:东方CJ
2016/10/12 全球购物
英国最大的天然和有机产品在线零售商之一:Big Green Smile
2020/05/06 全球购物
十佳文明家庭事迹
2014/05/25 职场文书
党员自我剖析材料(群众路线)
2014/10/06 职场文书
2015年教师党员公开承诺书
2015/01/22 职场文书
2015年教学工作总结
2015/04/02 职场文书
当幸福来敲门英文观后感
2015/06/01 职场文书
Python控制台输出俄罗斯方块移动和旋转功能
2021/04/18 Python
Vue vee-validate插件的简单使用
2021/06/22 Vue.js
MySQL里面的子查询的基本使用
2021/08/02 MySQL