Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python写的一个文本编辑器
Jan 23 Python
用Python进行基础的函数式编程的教程
Mar 31 Python
Python实现的RSS阅读器实例
Jul 25 Python
bpython 功能强大的Python shell
Feb 16 Python
python爬取拉勾网职位数据的方法
Jan 24 Python
tensorflow 1.0用CNN进行图像分类
Apr 15 Python
Python中XlsxWriter模块简介与用法分析
Apr 24 Python
详解python执行shell脚本创建用户及相关操作
Apr 11 Python
在python3中使用shuffle函数要注意的地方
Feb 28 Python
Python bytes string相互转换过程解析
Mar 05 Python
django Layui界面点击弹出对话框并请求逻辑生成分页的动态表格实例
May 12 Python
python中封包建立过程实例
Feb 18 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
PHP判断搜索引擎蜘蛛并自动记忆到文件的代码
2012/02/04 PHP
php准确获取文件MIME类型的方法
2015/06/17 PHP
详解PHP中的序列化、反序列化操作
2017/03/21 PHP
php中curl和soap方式请求服务超时问题的解决
2018/06/11 PHP
JavaScript中的Window窗口对象
2008/01/16 Javascript
js 模拟实现类似c#下的hashtable的简单功能代码
2010/01/24 Javascript
javascript右下角弹层及自动隐藏(自己编写)
2013/11/20 Javascript
jquery自动填充勾选框即把勾选框打上true
2014/03/24 Javascript
关于延迟加载JavaScript
2015/05/05 Javascript
jquery.cookie实现的客户端购物车操作实例
2015/12/24 Javascript
jQuery validate插件submitHandler提交导致死循环解决方法
2016/01/21 Javascript
关于function类中定义变量this的简单说明
2016/05/28 Javascript
AngularJS入门教程一:路由用法初探
2017/05/27 Javascript
JavaScript基本语法_动力节点Java学院整理
2017/06/26 Javascript
JScript实现地址选择功能
2017/08/15 Javascript
mock.js实现模拟生成假数据功能示例
2019/01/15 Javascript
微信小程序文字显示换行问题
2019/07/28 Javascript
vue v-model的用法解析
2020/10/19 Javascript
[01:06:07]2014 DOTA2国际邀请赛中国区预选赛5.21 DT VS CIS
2014/05/22 DOTA
Python实现Linux中的du命令
2017/06/12 Python
python实现五子棋小游戏
2020/03/25 Python
Pandas之ReIndex重新索引的实现
2019/06/25 Python
Tensorflow中的降维函数tf.reduce_*使用总结
2020/04/20 Python
scrapy爬虫:scrapy.FormRequest中formdata参数详解
2020/04/30 Python
Data URI scheme详解和使用实例及图片base64编码实现方法
2014/05/08 HTML / CSS
Bally美国官网:经典瑞士鞋履、手袋及配饰奢侈品牌
2018/05/18 全球购物
为什么要用EJB
2014/04/17 面试题
员工拓展培训方案
2014/02/15 职场文书
C++程序员求职信范文
2014/04/14 职场文书
机电系毕业生求职信
2014/07/11 职场文书
幼儿园保育员责任书
2014/07/22 职场文书
会议营销主持词
2015/07/03 职场文书
大学宣传委员竞选稿
2015/11/19 职场文书
python中tkinter复选框使用操作
2021/11/11 Python
第四次工业革命,打工人与机器人的竞争
2022/04/21 数码科技
利用正则表达式匹配浮点型数据
2022/05/30 Java/Android