Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
用Python编写一个简单的Lisp解释器的教程
Apr 03 Python
详解Python中for循环的使用方法
May 14 Python
python迭代dict的key和value的方法
Jul 06 Python
python跳出双层for循环的解决方法
Jun 24 Python
Django错误:TypeError at / 'bool' object is not callable解决
Aug 16 Python
Python基础之字符串操作常用函数集合
Feb 09 Python
Python使用configparser读取ini配置文件
May 25 Python
使用pth文件添加Python环境变量方式
May 26 Python
python新手学习可变和不可变对象
Jun 11 Python
Django中日期时间型字段进行年月日时分秒分组统计
Nov 27 Python
python对输出的奇数偶数排序实例代码
Dec 04 Python
python 定义函数 返回值只取其中一个的实现
May 21 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
融入意大利的咖啡文化
2021/03/03 咖啡文化
PHP 反射机制实现动态代理的代码
2008/10/22 PHP
php 编写安全的代码时容易犯的错误小结
2010/05/20 PHP
献给php初学者(入门学习经验谈)
2010/10/12 PHP
破解.net程序(dll文件)编译和反编译方法
2013/01/31 PHP
编译PHP报错configure error Cannot find libmysqlclient under usr的解决方法
2014/06/27 PHP
PHP版微信第三方实现一键登录及获取用户信息的方法
2016/10/14 PHP
PHP对XML内容进行修改和删除实例代码
2016/10/26 PHP
Zend Framework过滤器Zend_Filter用法详解
2016/12/09 PHP
PHP单元测试框架PHPUnit用法详解
2019/01/23 PHP
Laravel框架实现简单的学生信息管理平台案例
2019/05/07 PHP
javascript中使用replaceAll()函数实现字符替换的方法
2010/12/25 Javascript
jquery检测input checked 控件是否被选中的方法
2014/03/26 Javascript
JavaScript访问字符串中单个字符的两种方法
2015/07/03 Javascript
jQuery实现高亮显示网页关键词的方法
2015/08/07 Javascript
jquery ajax 如何向jsp提交表单数据
2015/08/23 Javascript
artDialog+plupload实现多文件上传
2016/07/19 Javascript
vue2利用Bus.js如何实现非父子组件通信详解
2017/08/25 Javascript
javascript+jQuery实现360开机时间显示效果
2017/11/03 jQuery
JQuery选中select组件被选中的值方法
2018/03/08 jQuery
node中间层实现文件上传功能
2018/06/11 Javascript
浅析Vue 防抖与节流的使用
2019/11/14 Javascript
[10:39]DOTA2上海特级锦标赛音乐会纪录片
2016/03/21 DOTA
go语言计算两个时间的时间差方法
2015/03/13 Python
Python发送email的3种方法
2015/04/28 Python
Numpy中stack(),hstack(),vstack()函数用法介绍及实例
2018/01/09 Python
Django 项目通过加载不同env文件来区分不同环境
2020/02/17 Python
python实现用户名密码校验
2020/03/18 Python
保密工作目标责任书
2014/07/28 职场文书
2015元旦联欢晚会结束语
2014/12/14 职场文书
2015年共青团工作总结
2015/05/15 职场文书
宇宙与人观后感
2015/06/05 职场文书
党员发展大会主持词
2015/07/03 职场文书
2015年公司国庆放假通知
2015/07/30 职场文书
pytorch中的torch.nn.Conv2d()函数图文详解
2022/02/28 Python
详解Redis的三种常用的缓存读写策略步骤
2022/05/06 Redis