python处理“


Posted in Python onJune 10, 2019

python如何处理“&#”开头加数字的html字符,比如:风水这类数据。

用python抓取数据时,有时会遇到想要数据是以“&#”开头加数字的字符,比如图中所示的这些:

风水大术士

python处理“

python处理“

这些字符需要再次转换才能变回中文内容。这些字符需要再次转换才能变回中文内容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

python处理“

定义变量,再定义转换代码。

python处理“

代码中最重要的是“data_parser = HTMLParser.HTMLParser()”,通过此才能用“.unescape()”方法。 

python处理“

测试运行,这串字符串正常输出了中文。

python处理“

Python3.7+版本

在最新python版本中,不能用上面的导入方法。可以用"import html"或者“from html import unescape”。这里使用"import html"做测试。

python处理“

导入html后,直接用".unescape()"来处理字符串。

python处理“

运行后,正常转换成了中文字符。

python处理“

感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python警察与小偷的实现之一客户端与服务端通信实例
Oct 09 Python
python实现删除文件与目录的方法
Nov 10 Python
python简单获取本机计算机名和IP地址的方法
Jun 03 Python
使用Python来开发Markdown脚本扩展的实例分享
Mar 04 Python
python 性能提升的几种方法
Jul 15 Python
win7+Python3.5下scrapy的安装方法
Jul 31 Python
Flask框架学习笔记之消息提示与异常处理操作详解
Aug 15 Python
Python importlib动态导入模块实现代码
Apr 16 Python
matlab、python中矩阵的互相导入导出方式
Jun 01 Python
Python实现寻找回文数字过程解析
Jun 09 Python
使用Python操作MySQL的小技巧
Sep 10 Python
python 实现mysql自动增删分区的方法
Apr 01 Python
python-pyinstaller、打包后获取路径的实例
Jun 10 #Python
详解Python 切片语法
Jun 10 #Python
使用Python OpenCV为CNN增加图像样本的实现
Jun 10 #Python
Python 虚拟空间的使用代码详解
Jun 10 #Python
在Python中过滤Windows文件名中的非法字符方法
Jun 10 #Python
对Python 检查文件名是否规范的实例详解
Jun 10 #Python
java判断三位数的实例讲解
Jun 10 #Python
You might like
超神学院:天使彦公认最美的三个视角,网友:我的天使快下凡吧!
2020/03/02 国漫
PHP日期时间函数的高级应用技巧
2009/05/16 PHP
服务器web工具 php环境下
2010/12/29 PHP
php获取YouTube视频信息的方法
2015/02/11 PHP
PHP读取大文件的多种方法介绍
2016/04/04 PHP
PHP树-不需要递归的实现方法
2016/06/21 PHP
Laravel中基于Artisan View扩展包创建及删除应用视图文件的方法
2016/10/08 PHP
给Javascript数组插入一条记录的代码
2007/08/30 Javascript
input、button的不同type值在ajax提交表单时导致的陷阱
2009/02/24 Javascript
别了 JavaScript中的isXX系列
2012/08/01 Javascript
用js将内容复制到剪贴板兼容浏览器
2014/03/18 Javascript
javascript带回调函数的异步脚本载入方法实例分析
2015/07/02 Javascript
js实现根据身份证号自动生成出生日期
2015/12/15 Javascript
JavaScript File分段上传
2016/03/10 Javascript
BootStrap中
2016/12/10 Javascript
webpack4 处理SCSS的方法示例
2018/09/03 Javascript
微信小程序前端promise封装代码实例
2019/08/24 Javascript
微信小程序开发(三):返回上一级页面并刷新操作示例【页面栈】
2020/06/01 Javascript
采用python实现简单QQ单用户机器人的方法
2014/07/03 Python
使用基于Python的Tornado框架的HTTP客户端的教程
2015/04/24 Python
通过Python使用saltstack生成服务器资产清单
2016/03/01 Python
使用Python AIML搭建聊天机器人的方法示例
2018/07/09 Python
python语音识别实践之百度语音API
2018/08/30 Python
Python地图绘制实操详解
2019/03/04 Python
Python3实现从排序数组中删除重复项算法分析
2019/04/03 Python
Python变量作用域LEGB用法解析
2020/02/04 Python
CSS3中的@keyframes关键帧动画的选择器绑定
2016/06/13 HTML / CSS
HTML5之WebGL 3D概述(上)—WebGL原生开发开启网页3D渲染新时代
2013/01/31 HTML / CSS
Ruby中的保护方法和私有方法与一般面向对象程序设计语言的一样吗
2013/05/01 面试题
后勤部经理岗位职责
2014/02/23 职场文书
大学生村官考核材料
2014/05/23 职场文书
合作协议书范文
2014/08/20 职场文书
2015年城乡环境综合治理工作总结
2015/07/24 职场文书
网吧管理制度范本
2015/08/05 职场文书
党务工作者主要事迹材料
2015/11/03 职场文书
2021年最新用于图像处理的Python库总结
2021/06/15 Python