Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python的id()函数解密过程
Dec 25 Python
python写的一个文本编辑器
Jan 23 Python
Python脚本实现网卡流量监控
Feb 14 Python
Python3 中文文件读写方法
Jan 23 Python
详解python分布式进程
Oct 08 Python
python基于C/S模式实现聊天室功能
Jan 09 Python
Python编写带选项的命令行程序方法
Aug 13 Python
浅谈Python3中print函数的换行
Aug 05 Python
Python getsizeof()和getsize()区分详解
Nov 20 Python
scrapy实践之翻页爬取的实现
Jan 05 Python
完美解决torch.cuda.is_available()一直返回False的玄学方法
Feb 06 Python
pytorch中的 .view()函数的用法介绍
Mar 17 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
php绘制圆形的方法
2015/01/24 PHP
php+mysql查询实现无限下级分类树输出示例
2016/10/03 PHP
gearman中任务的优先级和返回状态实例分析
2020/02/27 PHP
基于jQuery的烟花效果(运动相关)点击屏幕出烟花
2012/06/14 Javascript
js实现右下角可关闭最小化div(可用于展示推荐内容)
2013/06/24 Javascript
JS字符串截取函数实例
2013/12/27 Javascript
详解JavaScript的表达式与运算符
2015/11/30 Javascript
原生JavaScript编写canvas版的连连看游戏
2016/05/29 Javascript
基于jQuery实现仿百度首页选项卡切换效果
2016/05/29 Javascript
基于jQuery和hwSlider实现内容左右滑动切换效果附源码下载(一)
2016/06/22 Javascript
很棒的js选项卡切换效果
2016/07/15 Javascript
解析ajaxFileUpload 异步上传文件简单使用
2016/12/30 Javascript
Nodejs进阶:express+session实现简易登录身份认证
2017/04/24 NodeJs
Angular通过指令动态添加组件问题
2018/07/09 Javascript
[02:42]DOTA2城市挑战赛收官在即 四强之争风起云涌
2018/06/05 DOTA
python使用post提交数据到远程url的方法
2015/04/29 Python
Python实现将xml导入至excel
2015/11/20 Python
Python进阶篇之字典操作总结
2016/11/16 Python
Python正则抓取新闻标题和链接的方法示例
2017/04/24 Python
python bottle框架支持jquery ajax的RESTful风格的PUT和DELETE方法
2017/05/24 Python
PyQt5打开文件对话框QFileDialog实例代码
2018/02/07 Python
利用python如何处理百万条数据(适用java新手)
2018/06/06 Python
python 获得任意路径下的文件及其根目录的方法
2019/02/16 Python
Python二维数组实现求出3*3矩阵对角线元素的和示例
2019/11/29 Python
使用Python求解带约束的最优化问题详解
2020/02/11 Python
django中的数据库迁移的实现
2020/03/16 Python
python 字符串的驻留机制及优缺点
2020/06/19 Python
Python调用OpenCV实现图像平滑代码实例
2020/06/19 Python
上海方立数码笔试题
2013/10/18 面试题
LINUX下线程,GDI类的解释
2016/12/14 面试题
教育科学研究生自荐信
2013/10/09 职场文书
会计自荐书
2013/12/02 职场文书
2015感人爱情寄语
2015/02/26 职场文书
2015年学校保卫部工作总结
2015/05/11 职场文书
《静夜思》教学反思
2016/02/17 职场文书
Nginx部署vue项目和配置代理的问题解析
2021/08/04 Servers