Python chardet库识别编码原理解析


Posted in Python onFebruary 18, 2020

这篇文章主要介绍了python chardet库识别编码原理解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

chardet库是python的字符编码检测器,能够检测出各种编码的类型,例如:

import chardet
import urllib.request
 
testdata = urllib.request.urlopen('http://m2.cn.bing.com/').read()
print(chardet.detect(testdata))

运行结果:

{'confidence': 0.99, 'encoding': 'utf-8'}

翻译一下就是:

{'精准度': 99%, 'encoding(编码形式)': 'utf-8'}

没见识到这个库之前所有编码纯属自己的记忆:

# unicode_escape
\u4e2d\u56fd
# gbk或者utf-8
\xd6\xd0\xb9\xfa
中国
# urlencode
%e4%b8%ad%e5%9b%bd
# Gb2312
%d6%d0%b9%fa

这些编码纯属需要眼睛辨认再去网上查找编码,现在发现了chardet这个库后方便了很多

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的startswith和endswith函数使用实例
Aug 25 Python
python使用webbrowser浏览指定url的方法
Apr 04 Python
使用Python编写vim插件的简单示例
Apr 17 Python
python遍历小写英文字母的方法
Jan 02 Python
python爬取基于m3u8协议的ts文件并合并
Apr 26 Python
Django中reverse反转并且传递参数的方法
Aug 06 Python
Python PO设计模式的具体使用
Aug 16 Python
Selenium启动Chrome时配置选项详解
Mar 18 Python
Pytorch使用PIL和Numpy将单张图片转为Pytorch张量方式
May 25 Python
详解Windows下PyCharm安装Numpy包及无法安装问题解决方案
Jun 18 Python
Python 没有main函数的原因
Jul 10 Python
利用Python pandas对Excel进行合并的方法示例
Nov 04 Python
解决pytorch-yolov3 train 报错的问题
Feb 18 #Python
利用PyQt中的QThread类实现多线程
Feb 18 #Python
python 对任意数据和曲线进行拟合并求出函数表达式的三种解决方案
Feb 18 #Python
Python识别html主要文本框过程解析
Feb 18 #Python
pytorch实现seq2seq时对loss进行mask的方式
Feb 18 #Python
python多项式拟合之np.polyfit 和 np.polyld详解
Feb 18 #Python
tensorflow 分类损失函数使用小记
Feb 18 #Python
You might like
一个更简单的无限级分类菜单代码
2007/01/16 PHP
php中使用preg_replace函数匹配图片并加上链接的方法
2013/02/06 PHP
ThinkPHP3.1之D方法实例详解
2014/06/20 PHP
php列出mysql表所有行和列的方法
2015/03/13 PHP
教你在header中隐藏php的版本信息
2016/08/10 PHP
微信企业转账之入口类分装php代码
2018/10/01 PHP
javascript中动态加载js文件多种解决办法总结
2013/11/15 Javascript
js对图片base64编码字符串进行解码并输出图像示例
2014/03/17 Javascript
JavaScript中的类(Class)详细介绍
2014/12/30 Javascript
深入探寻javascript定时器
2015/01/02 Javascript
jQuery自动完成插件completer附源码下载
2016/01/04 Javascript
jQuery获得字体颜色16位码的方法
2016/02/20 Javascript
基于JS实现textarea中获取动态剩余字数的方法
2016/05/25 Javascript
js前端面试题及答案整理(一)
2016/08/26 Javascript
Angular工具方法学习
2016/12/26 Javascript
vue+vuex+axio从后台获取数据存入vuex实现组件之间共享数据
2017/04/22 Javascript
bootstrap table实现点击翻页功能 可记录上下页选中的行
2017/09/28 Javascript
微信小程序如何获取用户收货地址
2018/11/27 Javascript
python根据出生年份简单计算生肖的方法
2015/03/27 Python
在Python中使用列表生成式的教程
2015/04/27 Python
windows环境下tensorflow安装过程详解
2018/03/30 Python
python实现人人自动回复、抢沙发功能
2018/06/08 Python
深入分析python中整型不会溢出问题
2018/06/18 Python
详解Python数据可视化编程 - 词云生成并保存(jieba+WordCloud)
2019/03/26 Python
pandas-resample按时间聚合实例
2019/12/27 Python
宝拉珍选英国官网:Paula’s Choice英国
2019/05/29 全球购物
会计系中文个人求职信
2013/12/24 职场文书
八年级数学教学反思
2014/01/31 职场文书
2014年学习雷锋活动总结
2014/03/01 职场文书
实习护士自荐信
2014/06/21 职场文书
英语教研活动总结
2014/07/02 职场文书
开展党的群众路线教育实践活动个人对照检查材料
2014/11/05 职场文书
英文感谢信范文
2015/01/21 职场文书
离职信范本
2015/06/23 职场文书
html+css实现分层金字塔的实例
2021/06/02 HTML / CSS
CSS 鼠标点击拖拽效果的实现代码
2022/12/24 HTML / CSS