Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Ubuntu下使用python读取doc和docx文档的内容方法
May 08 Python
Python 批量合并多个txt文件的实例讲解
May 08 Python
Python中property函数用法实例分析
Jun 04 Python
Python3实现的Mysql数据库操作封装类
Jun 06 Python
Python实现拷贝/删除文件夹的方法详解
Aug 29 Python
用pycharm开发django项目示例代码
Jun 13 Python
python opencv 批量改变图片的尺寸大小的方法
Jun 28 Python
Python实现Restful API的例子
Aug 31 Python
python3 requests库实现多图片爬取教程
Dec 18 Python
python通过opencv实现图片裁剪原理解析
Jan 19 Python
Python龙贝格法求积分实例
Feb 29 Python
Python实现视频中添加音频工具详解
Dec 06 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
PHP 字符串分割和比较
2009/10/06 PHP
php 冒泡排序 交换排序法
2011/05/10 PHP
php mysql 判断update之后是否更新了的方法
2012/01/10 PHP
如何在Ubuntu下启动Apache的Rewrite功能
2013/07/05 PHP
jquery 插件 人性化的消息显示
2008/01/21 Javascript
html中table数据排序的js代码
2011/08/09 Javascript
jQuery contains过滤器实现精确匹配使用方法
2013/04/12 Javascript
jQuery回调函数的定义及用法实例
2014/12/23 Javascript
jquery中ajax跨域方法实例分析
2015/12/18 Javascript
jQuery Easyui学习之datagrid 动态添加、移除editor
2016/01/27 Javascript
BootstrapTable与KnockoutJS相结合实现增删改查功能【一】
2016/05/10 Javascript
canvas学习之API整理笔记(二)
2016/12/29 Javascript
在vue项目中使用md5加密的方法
2018/09/14 Javascript
如何为你的JavaScript代码日志着色详解
2019/04/08 Javascript
javascript 数组(list)添加/删除的实现
2020/12/17 Javascript
Python使用urllib2模块实现断点续传下载的方法
2015/06/17 Python
python学习之编写查询ip程序
2016/02/27 Python
Python下载网络文本数据到本地内存的四种实现方法示例
2018/02/05 Python
用Python PIL实现几个简单的图片特效
2019/01/18 Python
PyQt5创建一个新窗口的实例
2019/06/20 Python
Pycharm 2019 破解激活方法图文详解
2019/10/11 Python
解决python中0x80072ee2错误的方法
2020/07/19 Python
python 实现有道翻译功能
2021/02/26 Python
五款漂亮的纯CSS3动画按钮的实例教程
2014/11/21 HTML / CSS
Spartoo英国:欧洲最大的网上鞋店
2016/09/13 全球购物
阿迪达斯意大利在线商店:adidas意大利
2016/09/19 全球购物
英国拳击装备购物网站:RDX Sports
2018/01/23 全球购物
英语商务邀请函范文
2014/01/16 职场文书
毕业自我评价
2014/02/05 职场文书
优秀学生获奖感言
2014/02/15 职场文书
荷叶母亲教学反思
2014/04/30 职场文书
建筑工程技术专业求职信
2014/07/16 职场文书
教师群众路线学习心得体会
2014/11/04 职场文书
MySQL基础(一)
2021/04/05 MySQL
详解PHP Swoole与TCP三次握手
2021/05/27 PHP
Python使用mitmproxy工具监控手机 下载手机小视频
2022/04/18 Python