python处理“


Posted in Python onJune 10, 2019

python如何处理“&#”开头加数字的html字符,比如:风水这类数据。

用python抓取数据时,有时会遇到想要数据是以“&#”开头加数字的字符,比如图中所示的这些:

风水大术士

python处理“

python处理“

这些字符需要再次转换才能变回中文内容。这些字符需要再次转换才能变回中文内容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

python处理“

定义变量,再定义转换代码。

python处理“

代码中最重要的是“data_parser = HTMLParser.HTMLParser()”,通过此才能用“.unescape()”方法。 

python处理“

测试运行,这串字符串正常输出了中文。

python处理“

Python3.7+版本

在最新python版本中,不能用上面的导入方法。可以用"import html"或者“from html import unescape”。这里使用"import html"做测试。

python处理“

导入html后,直接用".unescape()"来处理字符串。

python处理“

运行后,正常转换成了中文字符。

python处理“

感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python实现在Linux系统下更改当前进程运行用户
Feb 04 Python
python实现二维码扫码自动登录淘宝
Dec 27 Python
使用pyecharts无法import Bar的解决方案
Apr 23 Python
python实现停车管理系统
Nov 30 Python
对python csv模块配置分隔符和引用符详解
Dec 12 Python
Scrapy框架爬取西刺代理网免费高匿代理的实现代码
Feb 22 Python
python3 图片 4通道转成3通道 1通道转成3通道 图片压缩实例
Dec 03 Python
Django基于客户端下载文件实现方法
Apr 21 Python
Python configparser模块操作代码实例
Jun 08 Python
Python同时处理多个异常的方法
Jul 28 Python
pycharm使用技巧之自动调整代码格式总结
Nov 04 Python
python爬虫中采集中遇到的问题整理
Nov 27 Python
python-pyinstaller、打包后获取路径的实例
Jun 10 #Python
详解Python 切片语法
Jun 10 #Python
使用Python OpenCV为CNN增加图像样本的实现
Jun 10 #Python
Python 虚拟空间的使用代码详解
Jun 10 #Python
在Python中过滤Windows文件名中的非法字符方法
Jun 10 #Python
对Python 检查文件名是否规范的实例详解
Jun 10 #Python
java判断三位数的实例讲解
Jun 10 #Python
You might like
php新建文件自动编号的思路与实现
2011/06/27 PHP
解析php通过cookies获取远程网页的指定代码
2013/06/25 PHP
php计算数组不为空元素个数的方法
2014/01/27 PHP
详解关于php的xdebug配置(编辑器vscode)
2019/01/29 PHP
CLASS_CONFUSION JS混淆 全源码
2007/12/12 Javascript
UI Events 用户界面事件
2012/06/27 Javascript
十个迅速提升JQuery性能让你的JQuery跑得更快
2012/12/10 Javascript
判断JS对象是否拥有某种属性的两种方式
2013/12/02 Javascript
JavaScript通过prototype给对象定义属性用法实例
2015/03/23 Javascript
jQuery实现可展开合拢的手风琴面板菜单
2015/09/15 Javascript
js实现动态加载脚本的方法实例汇总
2015/11/02 Javascript
jquery对象和DOM对象的任意相互转换
2016/02/21 Javascript
JavaScript常用判断写法大全(推荐)
2016/05/30 Javascript
jQuery实现右下角可缩放大小的层完整实例
2016/06/20 Javascript
AngularJS中transclude用法详解
2016/11/03 Javascript
Nodejs 搭建简单的Web服务器详解及实例
2016/11/30 NodeJs
JavaScript制作简易计算器(不用eval)
2017/02/05 Javascript
Bootstrap轮播图学习使用
2017/02/10 Javascript
JavaScript中数组Array方法详解
2017/02/27 Javascript
Bootstrap笔记之缩略图、警告框实例详解
2017/03/09 Javascript
Vue.js项目部署到服务器的详细步骤
2017/07/17 Javascript
不到200行 JavaScript 代码实现富文本编辑器的方法
2018/01/03 Javascript
使用ngrok+express解决本地环境中微信接口调试问题
2018/02/26 Javascript
Vue.js 中的 v-cloak 指令及使用详解
2018/11/19 Javascript
详解vue中localStorage的使用方法
2018/11/22 Javascript
node实现socket链接与GPRS进行通信的方法
2019/05/20 Javascript
如何利用Node.js与JSON搭建简单的动态服务器
2020/06/16 Javascript
Centos下实现安装Python3.6和Python2共存
2018/08/15 Python
pycharm实现猜数游戏
2020/12/07 Python
举例详解HTML5中使用JSON格式提交表单
2015/06/16 HTML / CSS
英国的屈臣氏:Boots博姿
2017/12/23 全球购物
美国机场停车位预订:About Airport Parking
2018/03/26 全球购物
彪马土耳其官网:PUMA土耳其
2019/07/14 全球购物
建筑个人求职信范文
2014/01/25 职场文书
詹天佑教学反思
2014/04/30 职场文书
2015年建筑工程工作总结
2015/05/13 职场文书