Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python中global用法实例分析
Apr 30 Python
python django 实现验证码的功能实例代码
May 18 Python
关于Python的一些学习总结
May 25 Python
python微信聊天机器人改进版(定时或触发抓取天气预报、励志语录等,向好友推送)
Apr 25 Python
python 随机生成10位数密码的实现代码
Jun 27 Python
Python如何输出整数
Jun 07 Python
numpy中生成随机数的几种常用函数(小结)
Aug 18 Python
scrapy与selenium结合爬取数据(爬取动态网站)的示例代码
Sep 28 Python
django中ImageField的使用详解
Dec 21 Python
详解用 python-docx 创建浮动图片
Jan 24 Python
一文搞懂Python Sklearn库使用
Aug 23 Python
Python可视化学习之matplotlib内置单颜色
Feb 24 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
PHP与MySQL开发中页面出现乱码的一种解决方法
2007/07/29 PHP
PHP优于Node.js的五大理由分享
2012/09/15 PHP
PHP获取MAC地址的具体实例
2013/12/13 PHP
PHP面向对象程序设计之命名空间与自动加载类详解
2016/12/02 PHP
javascript 面向对象编程基础:封装
2009/08/21 Javascript
jQuery实现高亮显示的方法
2015/03/10 Javascript
jQuery实现仿腾讯迷你首页选项卡效果代码
2015/09/17 Javascript
在其他地方你学不到的jQuery小贴士和技巧(欢迎收藏)
2016/01/20 Javascript
javascript 小数乘法结果错误的处理方法
2016/07/28 Javascript
BootStrap入门教程(一)之可视化布局
2016/09/19 Javascript
微信小程序 地图(map)实例详解
2016/11/16 Javascript
AngularJS指令中的绑定策略实例分析
2016/12/14 Javascript
jQuery+koa2实现简单的Ajax请求的示例
2018/03/06 jQuery
js实现一个简易计算器
2020/03/30 Javascript
改变layer confirm弹窗按钮的颜色方法
2019/09/12 Javascript
微信小程序国际化探索实现(附源码地址)
2020/05/20 Javascript
[57:59]完美世界DOTA2联赛循环赛 Ink Ice vs LBZS BO2第一场 11.05
2020/11/05 DOTA
Python __setattr__、 __getattr__、 __delattr__、__call__用法示例
2015/03/06 Python
python实现登陆知乎获得个人收藏并保存为word文件
2015/03/16 Python
python使用opencv进行人脸识别
2017/04/07 Python
Python学习笔记之open()函数打开文件路径报错问题
2018/04/28 Python
Python 计算任意两向量之间的夹角方法
2019/07/05 Python
Python函数的返回值、匿名函数lambda、filter函数、map函数、reduce函数用法实例分析
2019/12/26 Python
在Pytorch中计算卷积方法的区别详解(conv2d的区别)
2020/01/03 Python
HTML5 Web 存储详解
2016/09/16 HTML / CSS
英国最大的电子零件及配件零售商:Partmaster
2017/04/24 全球购物
Bose美国官网:购买Bose耳机和音箱
2019/03/10 全球购物
AJAX都有哪些有点和缺点
2012/11/03 面试题
行政总监岗位职责
2013/12/05 职场文书
婚庆司仪主持词
2014/03/15 职场文书
法学专业求职信
2014/07/15 职场文书
《揠苗助长》教学反思
2016/02/20 职场文书
有关信念的名言语录集锦
2019/12/06 职场文书
前端JavaScript大管家 package.json
2021/11/02 Javascript
Mysql开启外网访问
2022/05/15 MySQL
使用Nginx+Tomcat实现负载均衡的全过程
2022/05/30 Servers