python字符串编码识别模块chardet简单应用


Posted in Python onJune 15, 2015

python的字符串编码识别模块(第三方库):

官方地址: http://pypi.python.org/pypi/chardet

import chardet
import urllib
 
# 可根据需要,选择不同的数据
TestData = urllib.urlopen('http://www.baidu.com/').read()
print chardet.detect(TestData)
 
# 运行结果:
# {'confidence': 0.99, 'encoding': 'GB2312'}
运行结果表示有99%的概率认为这段代码是GB2312编码方式。
 
import urllib
from chardet.universaldetector import UniversalDetector
usock = urllib.urlopen('http://www.baidu.com/')
# 创建一个检测对象
detector = UniversalDetector()
for line in usock.readlines():
# 分块进行测试,直到达到阈值
detector.feed(line)
if detector.done: break
# 关闭检测对象
detector.close()
usock.close()
# 输出检测结果
print detector.result
 
# 运行结果:
# {'confidence': 0.99, 'encoding': 'GB2312'}

应用背景,如果要对一个大文件进行编码识别,使用这种高级的方法,可以只读一部,去判别编码方式从而提高检测速度。如果希望使用一个检测对象检测多个数据,在每次检测完,一定要运行一下detector.reset()。清除之前的数据。

以上所述就是本文的全部内容了,希望大家能够喜欢。

Python 相关文章推荐
Python 元组(Tuple)操作详解
Mar 11 Python
Python3 能振兴 Python的原因分析
Nov 28 Python
Python中的True,False条件判断实例分析
Jan 12 Python
python中字典dict常用操作方法实例总结
Apr 04 Python
Python爬取qq music中的音乐url及批量下载
Mar 23 Python
fastcgi文件读取漏洞之python扫描脚本
Apr 23 Python
彻底搞懂Python字符编码
Jan 23 Python
解决pycharm安装后代码区不能编辑的问题
Oct 28 Python
Python pandas用法最全整理
Aug 04 Python
python 扩展print打印文件路径和当前时间信息的实例代码
Oct 11 Python
使用pygame写一个古诗词填空通关游戏
Dec 03 Python
Python PIL按比例裁剪图片
May 11 Python
Python字符串格式化
Jun 15 #Python
Java中重定向输出流实现用文件记录程序日志
Jun 12 #Python
Python2中的raw_input() 与 input()
Jun 12 #Python
Windows下实现Python2和Python3两个版共存的方法
Jun 12 #Python
Python3中的2to3转换工具使用示例
Jun 12 #Python
Python中unittest模块做UT(单元测试)使用实例
Jun 12 #Python
搞笑的程序猿:看看你是哪种Python程序员
Jun 12 #Python
You might like
php中0,null,empty,空,false,字符串关系的详细介绍
2013/06/20 PHP
使用PHP生成二维码的两种方法(带logo图像)
2014/03/14 PHP
CI使用Tank Auth转移数据库导致密码用户错误的解决办法
2014/06/12 PHP
搭建基于Docker的PHP开发环境的详细教程
2015/07/01 PHP
WordPress中自定义后台管理界面配色方案的小技巧
2015/12/29 PHP
如何使用php等比例缩放图片
2016/10/12 PHP
详解PHP使用Redis存储session时的一个Warning定位
2017/07/05 PHP
购物车实现的几种方式优缺点对比
2018/05/02 PHP
对 jQuery 中 data 方法的误解分析
2014/06/18 Javascript
JavaScript插件化开发教程 (四)
2015/01/27 Javascript
如何实现chrome浏览器关闭页面时弹出“确定要离开此面吗?”
2015/03/05 Javascript
vue.js初学入门教程(1)
2016/11/03 Javascript
使用jQuery操作DOM的方法小结
2017/02/27 Javascript
mongoose设置unique不生效问题的解决及如何移除unique的限制
2017/11/07 Javascript
vue 使用ref 让父组件调用子组件的方法
2018/02/08 Javascript
JavaScript 隐性类型转换步骤浅析
2018/03/15 Javascript
JS栈stack类的实现与使用方法示例
2019/01/31 Javascript
ES6 Iterator接口和for...of循环用法分析
2019/07/31 Javascript
python在多玩图片上下载妹子图的实现代码
2013/08/13 Python
Python处理JSON数据并生成条形图
2016/08/05 Python
浅谈使用Python变量时要避免的3个错误
2017/10/30 Python
python中numpy.zeros(np.zeros)的使用方法
2017/11/07 Python
python3基于OpenCV实现证件照背景替换
2018/07/18 Python
python单例模式实例解析
2018/08/28 Python
超简单使用Python换脸实例
2019/03/27 Python
Python实现账号密码输错三次即锁定功能简单示例
2019/03/29 Python
使用Python的networkx绘制精美网络图教程
2019/11/21 Python
Python object类中的特殊方法代码讲解
2020/03/06 Python
Python制作一个仿QQ办公版的图形登录界面
2020/09/22 Python
英国领先的奢侈品零售商之一:CRUISE
2016/12/02 全球购物
大学生实习期自我评价范文
2013/10/03 职场文书
收银出纳员岗位职责
2014/02/23 职场文书
暑假社会实践心得体会
2014/09/02 职场文书
2014年度个人工作总结范文
2015/03/09 职场文书
婚礼必备主持词范本!
2019/07/23 职场文书
vue3使用vuedraggable实现拖拽功能
2022/04/06 Vue.js