Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python冲顶大会 快来答题!
Jan 17 Python
python使用socket创建tcp服务器和客户端
Apr 12 Python
python3判断url链接是否为404的方法
Aug 10 Python
Python3爬虫之urllib携带cookie爬取网页的方法
Dec 28 Python
pyshp创建shp点文件的方法
Dec 31 Python
python多进程下实现日志记录按时间分割
Jul 22 Python
python 类的继承 实例方法.静态方法.类方法的代码解析
Aug 23 Python
Python 实现将数组/矩阵转换成Image类
Jan 09 Python
浅谈keras.callbacks设置模型保存策略
Jun 18 Python
python3跳出一个循环的实例操作
Aug 18 Python
python 如何调用远程接口
Sep 11 Python
Python中Pyspider爬虫框架的基本使用详解
Jan 27 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
php实现用户登陆简单实例
2017/04/04 PHP
php微信公众号开发之图片回复
2018/10/20 PHP
破除网页鼠标右键被禁用的绝招大全
2006/12/27 Javascript
JQuery 学习笔记 element属性控制
2009/07/23 Javascript
Node.js事件驱动
2015/06/18 Javascript
Backbone.js的Hello World程序实例
2015/06/19 Javascript
js跨域请求的5中解决方式
2015/07/02 Javascript
JS+CSS实现鼠标滑过时动态翻滚的导航条效果
2015/09/24 Javascript
Angularjs---项目搭建图文教程
2016/07/08 Javascript
JavaScript中日期函数的相关操作知识
2016/08/03 Javascript
JavaScript 异步调用
2017/10/25 Javascript
Vue2.0 axios前后端登陆拦截器(实例讲解)
2017/10/27 Javascript
vue cli使用绝对路径引用图片问题的解决
2017/12/06 Javascript
Express进阶之log4js实用入门指南
2018/02/10 Javascript
Nodejs异步回调之异常处理实例分析
2018/06/22 NodeJs
JS实现随机抽选获奖者
2019/11/07 Javascript
ant design vue嵌套表格及表格内部编辑的用法说明
2020/10/28 Javascript
[03:24]DOTA2超级联赛专访hao 大翻盘就是逆袭
2013/05/24 DOTA
[43:32]Winstrike vs VGJ.S 2018国际邀请赛淘汰赛BO3 第一场 8.23
2018/08/24 DOTA
Python编写一个闹钟功能
2017/07/11 Python
Python语言的变量认识及操作方法
2018/02/11 Python
python3+mysql查询数据并通过邮件群发excel附件
2018/02/24 Python
linux中如何使用python3获取ip地址
2019/07/15 Python
python实现图片上添加图片
2019/11/26 Python
python Jupyter运行时间实例过程解析
2019/12/13 Python
Python图像处理库PIL的ImageDraw模块介绍详解
2020/02/26 Python
Python中有几个关键字
2020/06/04 Python
python 爬虫如何实现百度翻译
2020/11/16 Python
实现CSS3中的border-radius(边框圆角)示例代码
2013/07/19 HTML / CSS
Mybag美国/加拿大:英国奢华包包和名牌手袋网站
2020/02/16 全球购物
初中校园之声广播稿
2014/01/15 职场文书
大学生社团活动总结
2014/04/26 职场文书
企业整改报告范文
2014/11/08 职场文书
学校推普周活动总结
2015/05/07 职场文书
2015年机关党建工作总结
2015/05/22 职场文书
公司开业的祝贺语大全(60条)
2019/07/05 职场文书