Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python读写unicode文件的方法
Jul 10 Python
python开发之文件操作用法实例
Nov 13 Python
Django接受前端数据的几种方法总结
Nov 04 Python
使用Python如何测试InnoDB与MyISAM的读写性能
Sep 18 Python
Django如何自定义分页
Sep 25 Python
python 自动重连wifi windows的方法
Dec 18 Python
python itchat实现调用微信接口的第三方模块方法
Jun 11 Python
python 利用turtle库绘制笑脸和哭脸的例子
Nov 23 Python
Python编译为二进制so可执行文件实例
Dec 23 Python
pycharm 实现复制一行的快捷键
Jan 15 Python
Python数据模型与Python对象模型的相关总结
Jan 26 Python
基于PyTorch实现一个简单的CNN图像分类器
May 29 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
php桌面中心(二) 数据库写入
2007/03/11 PHP
php去除HTML标签实例
2013/11/06 PHP
ThinkPHP中U方法的使用浅析
2014/06/13 PHP
php递归创建目录的方法
2015/02/02 PHP
Codeigniter控制器controller继承问题实例分析
2016/01/19 PHP
DWZ+ThinkPHP开发时遇到的问题分析
2016/12/12 PHP
PHP与Perl之间知识点区别整理
2019/03/19 PHP
JavaScript中的Screen屏幕对象
2008/01/16 Javascript
很可爱的输入框
2008/08/03 Javascript
浅谈nodeName,nodeValue,nodeType,typeof 的区别
2015/01/13 Javascript
javascript实现瀑布流自适应遇到的问题及解决方案
2015/01/28 Javascript
js实现格式化金额,字符,时间的方法
2015/02/26 Javascript
jQuery基于函数重载实现自定义Alert函数样式的方法
2016/07/27 Javascript
极力推荐10个短小实用的JavaScript代码段
2016/08/03 Javascript
JS模拟实现ECMAScript5新增的数组方法
2017/03/20 Javascript
基于twbsPagination.js分页插件使用心得(分享)
2017/10/21 Javascript
微信小程序实现tab页面切换功能
2018/07/13 Javascript
jQuery实现模拟搜索引擎的智能提示功能简单示例
2019/01/27 jQuery
基于iview的router常用控制方式
2019/05/30 Javascript
bootstrap datepicker的基本使用教程
2019/07/09 Javascript
Python对小数进行除法运算的正确方法示例
2014/08/25 Python
浅谈终端直接执行py文件,不需要python命令
2017/01/23 Python
Numpy数组array和矩阵matrix转换方法
2019/08/05 Python
Python绘制热力图示例
2019/09/27 Python
详解Python中的文件操作
2021/01/14 Python
CSS3结构性伪类选择器九种写法
2012/04/18 HTML / CSS
css3实现一款模仿iphone样式的注册表单
2013/03/20 HTML / CSS
html5构建触屏网站之touch事件介绍
2013/01/07 HTML / CSS
美国儿童玩具、装扮和玩偶商店:Magic Cabin
2018/09/02 全球购物
切尔西足球俱乐部官方网上商店:Chelsea FC
2019/06/17 全球购物
工作过失检讨书
2014/02/23 职场文书
数控技校生自我鉴定
2014/03/02 职场文书
正科级干部考察材料
2014/05/29 职场文书
收银员岗位职责范本
2015/04/07 职场文书
MySQL表字段时间设置默认值
2021/05/13 MySQL
mysql实现将字符串字段转为数字排序或比大小
2022/06/14 MySQL