python处理“


Posted in Python onJune 10, 2019

python如何处理“&#”开头加数字的html字符,比如:风水这类数据。

用python抓取数据时,有时会遇到想要数据是以“&#”开头加数字的字符,比如图中所示的这些:

风水大术士

python处理“

python处理“

这些字符需要再次转换才能变回中文内容。这些字符需要再次转换才能变回中文内容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

python处理“

定义变量,再定义转换代码。

python处理“

代码中最重要的是“data_parser = HTMLParser.HTMLParser()”,通过此才能用“.unescape()”方法。 

python处理“

测试运行,这串字符串正常输出了中文。

python处理“

Python3.7+版本

在最新python版本中,不能用上面的导入方法。可以用"import html"或者“from html import unescape”。这里使用"import html"做测试。

python处理“

导入html后,直接用".unescape()"来处理字符串。

python处理“

运行后,正常转换成了中文字符。

python处理“

感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python读取ini文件、操作mysql、发送邮件实例
Jan 01 Python
python list是否包含另一个list所有元素的实例
May 04 Python
python 地图经纬度转换、纠偏的实例代码
Aug 06 Python
Python中asyncio与aiohttp入门教程
Oct 16 Python
Python 正则表达式匹配字符串中的http链接方法
Dec 25 Python
python3.7简单的爬虫实例详解
Jul 08 Python
python list转置和前后反转的例子
Aug 26 Python
pytorch中tensor张量数据类型的转化方式
Dec 31 Python
tensorflow实现训练变量checkpoint的保存与读取
Feb 10 Python
python中如何设置代码自动提示
Jul 15 Python
Windows环境下Python3.6.8 importError: DLLload failed:找不到指定的模块
Nov 01 Python
python神经网络编程之手写数字识别
May 08 Python
python-pyinstaller、打包后获取路径的实例
Jun 10 #Python
详解Python 切片语法
Jun 10 #Python
使用Python OpenCV为CNN增加图像样本的实现
Jun 10 #Python
Python 虚拟空间的使用代码详解
Jun 10 #Python
在Python中过滤Windows文件名中的非法字符方法
Jun 10 #Python
对Python 检查文件名是否规范的实例详解
Jun 10 #Python
java判断三位数的实例讲解
Jun 10 #Python
You might like
PHP脚本的10个技巧(8)
2006/10/09 PHP
MySQL授权问题总结
2007/05/06 PHP
getJSON跨域SyntaxError问题分析
2014/08/07 PHP
PHP消息队列用法实例分析
2016/02/12 PHP
浅谈PHP安全防护之Web攻击
2017/01/03 PHP
Nigma vs Alliance BO5 第三场2.14
2021/03/10 DOTA
Javascript的构造函数和constructor属性
2010/01/09 Javascript
JavaScript中String和StringBuffer的速度之争
2010/04/01 Javascript
JQuery Dialog的内存泄露问题解决方法
2010/06/18 Javascript
[JSF]使用DataModel处理表行事件的实例代码
2013/08/05 Javascript
JavaScript实现的内存数据库LokiJS介绍和入门实例
2014/11/17 Javascript
javascript实现网页中涉及的简易运动(改变宽高、透明度、位置)
2015/11/29 Javascript
Javascript将数字转化成为货币格式字符串
2016/06/22 Javascript
gulp加批处理(.bat)实现ng多应用一键自动化构建
2017/02/16 Javascript
Angular4的输入属性与输出属性实例详解
2017/11/29 Javascript
浅谈AngularJs 双向绑定原理(数据绑定机制)
2017/12/07 Javascript
angular 实现下拉列表组件的示例代码
2019/03/09 Javascript
详解js获取video任意时间的画面截图
2019/04/17 Javascript
js 获取扫码枪输入数据的方法
2020/06/10 Javascript
在Debian下配置Python+Django+Nginx+uWSGI+MySQL的教程
2015/04/25 Python
python 获取list特定元素下标的实例讲解
2018/04/09 Python
pycharm 将django中多个app放到同个文件夹apps的处理方法
2018/05/30 Python
flask框架jinja2模板与模板继承实例分析
2019/08/01 Python
Selenium 滚动页面至元素可见的方法
2020/03/18 Python
python 监控服务器是否有人远程登录(详细思路+代码)
2020/12/18 Python
Bootstrap 学习分享
2012/11/12 HTML / CSS
中国双语服务优势的在线购票及活动平台:247tickets
2018/10/26 全球购物
酒店保洁主管岗位职责
2013/11/28 职场文书
内业资料员岗位职责
2014/01/04 职场文书
音乐教学反思
2014/02/02 职场文书
护士见习期自我鉴定
2014/02/08 职场文书
物理研修随笔感言
2014/02/14 职场文书
会议通知范文
2015/04/15 职场文书
关于销售人员的年终工作总结要点
2019/08/15 职场文书
导游词之桂林山水
2019/09/20 职场文书
浅谈MySQL中的六种日志
2022/03/23 MySQL