Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python 示例分享---逻辑推理编程解决八皇后
Jul 20 Python
Python中对列表排序实例
Jan 04 Python
python继承和抽象类的实现方法
Jan 14 Python
简化Python的Django框架代码的一些示例
Apr 20 Python
详解Python操作RabbitMQ服务器消息队列的远程结果返回
Jun 30 Python
pandas 取出表中一列数据所有的值并转换为array类型的方法
Apr 11 Python
对Python subprocess.Popen子进程管道阻塞详解
Oct 29 Python
在双python下设置python3为默认的方法
Oct 31 Python
python实现可变变量名方法详解
Jul 01 Python
如何解决python多种版本冲突问题
Oct 13 Python
python调试工具Birdseye的使用教程
May 25 Python
python中取整数的几种方法
Nov 07 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
php与paypal整合方法
2010/11/28 PHP
PHP常用特殊运算符号和函数总结(php新手入门必看)
2013/02/02 PHP
PHP中你应该知道的require()文件包含的正确用法
2015/06/12 PHP
PHP正则表达式过滤html标签属性(DEMO)
2016/05/04 PHP
php封装db类连接sqlite3数据库的方法实例
2017/12/19 PHP
javascript 多种搜索引擎集成的页面实现代码
2010/01/02 Javascript
基于Jquery代码实现支持PC端手机端幻灯片代码
2015/11/17 Javascript
jquery trigger实现联动的方法
2016/02/29 Javascript
[原创]JavaScript语法高亮插件highlight.js用法详解【附highlight.js本站下载】
2016/11/01 Javascript
脚本div实现拖放功能(两种)
2017/02/13 Javascript
nodejs入门教程二:创建一个简单应用示例
2017/04/24 NodeJs
angularjs+bootstrap实现自定义分页的实例代码
2017/06/19 Javascript
js判断文件类型大小并给出提示的实现方法
2018/01/03 Javascript
Webpack的dll功能使用
2018/06/28 Javascript
Vue高版本中一些新特性的使用详解
2018/09/25 Javascript
JavaScript实现连连看连线算法
2019/01/05 Javascript
layui-table获得当前行的上/下一行数据的例子
2019/09/24 Javascript
JavaScript获取当前url路径过程解析
2019/12/27 Javascript
Vue 实现简易多行滚动"弹幕"效果
2020/01/02 Javascript
Vue element-ui父组件控制子组件的表单校验操作
2020/07/17 Javascript
python正则表达式判断字符串是否是全部小写示例
2013/12/25 Python
Python利用多进程将大量数据放入有限内存的教程
2015/04/01 Python
python3+selenium实现qq邮箱登陆并发送邮件功能
2019/01/23 Python
python支持多线程的爬虫实例
2019/12/21 Python
Python实现自动签到脚本功能
2020/08/20 Python
使用css3制作登录表单的步骤
2014/04/07 HTML / CSS
世界领先的高品质定制产品平台:Zazzle
2017/07/23 全球购物
NBA欧洲商店(西班牙):NBA Europe Store ES
2019/04/16 全球购物
保送生自荐信范文
2013/10/06 职场文书
军人违纪检讨书
2014/02/04 职场文书
一句话工作感言
2014/03/01 职场文书
《将心比心》教学反思
2014/04/08 职场文书
倡议书的写法
2014/08/30 职场文书
局机关干部群众路线个人对照检查材料思想汇报
2014/10/05 职场文书
学习心理学心得体会
2016/01/22 职场文书
python基础之文件处理知识总结
2021/05/23 Python