Python使用chardet判断字符编码


Posted in Python onMay 09, 2015

本文实例讲述了Python使用chardet判断字符编码的方法。分享给大家供大家参考。具体分析如下:

Python中chardet 用来实现字符串/文件编码检测模板

1、chardet下载与安装

下载地址:http://pypi.python.org/pypi/chardet

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了,也可以将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install

2、实例

使用中,chardet.detect()返回字典,其中confidence是检测精确度,encoding是编码形式

(1)网页编码判断:

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}

(2)文件编码判断

import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#这里试着换成read(5)也可以,但是换成readlines()后报错
enc=chardet.detect(ff)
print enc['encoding']
tt.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
python的绘图工具matplotlib使用实例
Jul 03 Python
举例讲解Python程序与系统shell交互的方式
Apr 09 Python
Python中__init__.py文件的作用详解
Sep 18 Python
关于numpy中np.nonzero()函数用法的详解
Feb 07 Python
Python 文件操作的详解及实例
Sep 18 Python
Python插件virtualenv搭建虚拟环境
Nov 20 Python
Python连接Mssql基础教程之Python库pymssql
Sep 16 Python
详解DeBug Python神级工具PySnooper
Jul 03 Python
运用PyTorch动手搭建一个共享单车预测器
Aug 06 Python
对Django 中request.get和request.post的区别详解
Aug 12 Python
修改Pandas的行或列的名字(重命名)
Dec 18 Python
python_matplotlib改变横坐标和纵坐标上的刻度(ticks)方式
May 16 Python
python操作ie登陆土豆网的方法
May 09 #Python
Python检测QQ在线状态的方法
May 09 #Python
python常见数制转换实例分析
May 09 #Python
python读写二进制文件的方法
May 09 #Python
Python求导数的方法
May 09 #Python
Python itertools模块详解
May 09 #Python
python读取word文档的方法
May 09 #Python
You might like
Window下PHP三种运行方式图文详解
2013/06/11 PHP
10个实用的PHP正则表达式汇总
2014/10/23 PHP
mysql_escape_string()函数用法分析
2016/04/25 PHP
php文件管理基本功能简单操作
2017/01/16 PHP
PHP基于pdo的数据库操作类【可支持mysql、sqlserver及oracle】
2018/05/21 PHP
PHP获取本周所有日期或者最近七天所有日期的方法
2018/06/20 PHP
基于php伪静态的实现方法解析
2020/07/31 PHP
利用jQuery的deferred对象实现异步按顺序加载JS文件
2013/03/17 Javascript
Javascript闭包用法实例分析
2015/01/23 Javascript
JavaScript实现iframe自动高度调整和不同主域名跨域
2016/02/27 Javascript
整理一下常见的IE错误
2016/11/18 Javascript
JS根据生日月份和日期计算星座的简单实现方法
2016/11/24 Javascript
JavaScript实现的超简单计算器功能示例
2017/12/23 Javascript
vue源码入口文件分析(推荐)
2018/01/30 Javascript
Vue项目中ESlint规范示例代码
2019/07/04 Javascript
详解基于Vue的支持数据双向绑定的select组件
2019/09/02 Javascript
JavaScript中0、空字符串、'0'是true还是false的知识点分享
2019/09/16 Javascript
python命令行参数解析OptionParser类用法实例
2014/10/09 Python
Python操作串口的方法
2015/06/17 Python
彻底搞懂Python字符编码
2018/01/23 Python
使用Filter过滤python中的日志输出的实现方法
2019/07/17 Python
Python代码实现http/https代理服务器的脚本
2019/08/12 Python
解决django后台管理界面添加中文内容乱码问题
2019/11/15 Python
Jupyter Notebook打开任意文件夹操作
2020/04/14 Python
Python基于正则表达式实现计算器功能
2020/07/13 Python
python 常见的反爬虫策略
2020/09/27 Python
python3 通过 pybind11 使用Eigen加速代码的步骤详解
2020/12/07 Python
HTML5的结构和语义(3):语义性的块级元素
2008/10/17 HTML / CSS
mui几种页面跳转方式对比总结概括
2017/08/18 HTML / CSS
详解canvas.toDataURL()报错的解决方案全都在这了
2020/03/31 HTML / CSS
美国知名男士服饰品牌:Brooks Brothers(布克兄弟)
2016/08/25 全球购物
戴森美国官网:Dyson美国
2016/09/11 全球购物
大专生自荐信
2013/10/04 职场文书
企业统计员岗位职责
2013/12/13 职场文书
师德师风个人反思
2014/04/28 职场文书
2015年女职工工作总结
2015/05/15 职场文书