Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python时区设置方法与pytz查询时区教程
Nov 27 Python
介绍Python的@property装饰器的用法
Apr 28 Python
详解Python网络爬虫功能的基本写法
Jan 28 Python
Python实现统计文本文件字数的方法
May 05 Python
浅谈python中的__init__、__new__和__call__方法
Jul 18 Python
Python协程的用法和例子详解
Sep 09 Python
numpy 进行数组拼接,分别在行和列上合并的实例
May 08 Python
python3中pip3安装出错,找不到SSL的解决方式
Dec 12 Python
Python如何访问字符串中的值
Feb 09 Python
appium+python adb常用命令分享
Mar 06 Python
Django中使用Json返回数据的实现方法
Jun 03 Python
pycharm激活码免费分享适用最新pycharm2020.2.3永久激活
Nov 25 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
php 获取百度的热词数据的代码
2012/02/18 PHP
PHP序列化操作方法分析
2016/09/28 PHP
combox改进版 页面原型参考dojo的,比网上jQuery的那些combox功能强,代码更小
2010/04/15 Javascript
jQuery 源码分析笔记(2) 变量列表
2011/05/28 Javascript
jquery弹出关闭遮罩层实例
2013/08/06 Javascript
jquery用offset()方法获得元素的xy坐标
2014/09/06 Javascript
JavaScript中扩展Array contains方法实例
2020/08/23 Javascript
jQuery实现鼠标滑向当前图片高亮显示并且其它图片变灰的方法
2015/07/27 Javascript
url传递的参数值中包含&时,url自动截断问题的解决方法
2016/08/02 Javascript
浅谈jQuery中hide和fadeOut的区别 show和fadeIn的区别
2016/08/18 Javascript
基于javascript的Form表单验证
2016/12/29 Javascript
easyui 中的datagrid跨页勾选问题的实现方法
2017/01/18 Javascript
用 js 的 selection range 操作选择区域内容和图片
2017/04/18 Javascript
如何在 Vue.js 中使用第三方js库
2017/04/25 Javascript
jQuery中each循环的跳出和结束实例
2017/08/16 jQuery
vue+SSM实现验证码功能
2018/12/07 Javascript
简单了解JavaScript异步
2019/05/23 Javascript
js 实现ajax发送步骤过程详解
2019/07/25 Javascript
JavaScript设计模式之观察者模式与发布订阅模式详解
2020/05/07 Javascript
Electron+vue从零开始打造一个本地播放器的方法示例
2020/10/27 Javascript
浅析python 中__name__ = '__main__' 的作用
2014/07/05 Python
Python 通过URL打开图片实例详解
2017/06/01 Python
Python实现希尔排序算法的原理与用法实例分析
2017/11/23 Python
python实现对excel进行数据剔除操作实例
2017/12/07 Python
Python调用百度根据经纬度查询地址的示例代码
2019/07/07 Python
python用线性回归预测股票价格的实现代码
2019/09/04 Python
python如何使用socketserver模块实现并发聊天
2019/12/14 Python
Python模拟FTP文件服务器的操作方法
2020/02/18 Python
基于python纯函数实现井字棋游戏
2020/05/27 Python
Bench加拿大官方网站:英国城市服装品牌
2017/11/03 全球购物
英国排名第一的停车场运营商:NCP
2019/08/26 全球购物
大学生毕业的自我评价分享
2014/01/02 职场文书
经典公益广告词
2014/03/13 职场文书
六一节目主持词
2014/04/01 职场文书
2015年员工试用期工作总结
2014/12/12 职场文书
防溺水安全教育主题班会
2015/08/12 职场文书