python处理“


Posted in Python onJune 10, 2019

python如何处理“&#”开头加数字的html字符,比如:风水这类数据。

用python抓取数据时,有时会遇到想要数据是以“&#”开头加数字的字符,比如图中所示的这些:

风水大术士

python处理“

python处理“

这些字符需要再次转换才能变回中文内容。这些字符需要再次转换才能变回中文内容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

python处理“

定义变量,再定义转换代码。

python处理“

代码中最重要的是“data_parser = HTMLParser.HTMLParser()”,通过此才能用“.unescape()”方法。 

python处理“

测试运行,这串字符串正常输出了中文。

python处理“

Python3.7+版本

在最新python版本中,不能用上面的导入方法。可以用"import html"或者“from html import unescape”。这里使用"import html"做测试。

python处理“

导入html后,直接用".unescape()"来处理字符串。

python处理“

运行后,正常转换成了中文字符。

python处理“

感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python lxml模块安装教程
Jun 02 Python
Python开发之快速搭建自动回复微信公众号功能
Apr 22 Python
12步入门Python中的decorator装饰器使用方法
Jun 20 Python
Python元字符的用法实例解析
Jan 17 Python
Python subprocess模块常见用法分析
Jun 12 Python
解决python ogr shp字段写入中文乱码的问题
Dec 31 Python
python dict 相同key 合并value的实例
Jan 21 Python
75条笑死人的知乎神回复,用60行代码就爬完了
May 06 Python
python如何制作英文字典
Jun 25 Python
升级keras解决load_weights()中的未定义skip_mismatch关键字问题
Jun 12 Python
Keras搭建自编码器操作
Jul 03 Python
Django 如何实现文件上传下载
Apr 08 Python
python-pyinstaller、打包后获取路径的实例
Jun 10 #Python
详解Python 切片语法
Jun 10 #Python
使用Python OpenCV为CNN增加图像样本的实现
Jun 10 #Python
Python 虚拟空间的使用代码详解
Jun 10 #Python
在Python中过滤Windows文件名中的非法字符方法
Jun 10 #Python
对Python 检查文件名是否规范的实例详解
Jun 10 #Python
java判断三位数的实例讲解
Jun 10 #Python
You might like
基于mysql的论坛(4)
2006/10/09 PHP
php获取网卡的MAC地址支持WIN/LINUX系统
2014/04/30 PHP
PHP实现的连贯操作、链式操作实例
2014/07/08 PHP
php让json_encode不自动转义斜杠“/”的方法
2020/04/27 PHP
javascript Firefox与IE 替换节点的方法
2010/02/24 Javascript
最佳JS代码编写的14条技巧
2011/01/09 Javascript
ECMAScript 5中的属性描述符详解
2015/03/02 Javascript
easyui Droppable组件实现放置特效
2015/08/19 Javascript
Bootstrap源码解读标签、徽章、缩略图和警示框(8)
2016/12/26 Javascript
javascript表单正则应用
2017/02/04 Javascript
详解React Native 屏幕适配(炒鸡简单的方法)
2018/06/11 Javascript
解决vue单页路由跳转后scrollTop的问题
2018/09/03 Javascript
bootstrap-table+treegrid实现树形表格
2019/07/26 Javascript
jQuery操作元素的内容和样式完整实例分析
2020/01/10 jQuery
利用js canvas实现五子棋游戏
2020/10/11 Javascript
[02:38]DOTA2亚洲邀请赛小组赛精彩集锦:Wings完美团击溃对手
2017/03/29 DOTA
详解Python中的变量及其命名和打印
2016/03/11 Python
Python对文件和目录进行操作的方法(file对象/os/os.path/shutil 模块)
2017/05/08 Python
Python实现发送QQ邮件的封装
2017/07/14 Python
Python简单实现阿拉伯数字和罗马数字的互相转换功能示例
2018/04/17 Python
python获取指定字符串中重复模式最高的字符串方法
2018/06/29 Python
Python拼接微信好友头像大图的实现方法
2018/08/01 Python
Python爬虫库BeautifulSoup获取对象(标签)名,属性,内容,注释
2020/01/25 Python
使用CSS变量实现炫酷惊人的悬浮效果
2019/04/26 HTML / CSS
HTML5 UTF-8 中文乱码的解决方法
2013/11/18 HTML / CSS
彪马英国官网:PUMA英国
2019/02/11 全球购物
德尔福集团DELPHI的笔试题
2012/02/22 面试题
大学生个人求职信范文
2013/09/21 职场文书
医学实习生自我鉴定
2013/12/12 职场文书
新颖的化妆品活动方案
2014/08/21 职场文书
四风个人对照检查材料思想汇报(办公室通用版)
2014/10/07 职场文书
电力企业职工培训心得体会
2016/01/11 职场文书
Redis安装启动及常见数据类型
2021/04/14 Redis
在Centos 8.0中安装Redis服务器的教程详解
2022/03/21 Redis
解决spring.thymeleaf.cache=false不起作用的问题
2022/06/10 Java/Android
pandas中pd.groupby()的用法详解
2022/06/16 Python