Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
pygame学习笔记(5):游戏精灵
Apr 15 Python
python安装以及IDE的配置教程
Apr 29 Python
python语言使用技巧分享
May 31 Python
听歌识曲--用python实现一个音乐检索器的功能
Nov 15 Python
Python 网页解析HTMLParse的实例详解
Aug 10 Python
python实现协同过滤推荐算法完整代码示例
Dec 15 Python
python使用selenium登录QQ邮箱(附带滑动解锁)
Jan 23 Python
Python 实现遥感影像波段组合的示例代码
Aug 04 Python
Python操作excel的方法总结(xlrd、xlwt、openpyxl)
Sep 02 Python
python实现的多任务版udp聊天器功能案例
Nov 13 Python
pycharm中选中一个单词替换所有重复单词的实现方法
Nov 17 Python
Python中使用Lambda函数的5种用法
Apr 01 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
浅析PKI加密解密 OpenSSL
2013/07/01 PHP
PHP获取POST数据的几种方法汇总
2015/03/03 PHP
PHP 信号管理知识整理汇总
2017/02/19 PHP
PHP中empty,isset,is_null用法和区别
2017/02/19 PHP
使用jQuery简化Ajax开发 Ajax开发入门
2009/10/14 Javascript
javascript中的注释使用与注意事项小结
2011/09/20 Javascript
ExtJs设置GridPanel表格文本垂直居中示例
2013/07/15 Javascript
JavaScript实现列出数组中最长的连续数
2014/12/29 Javascript
js实现的tab标签切换效果代码分享
2015/08/25 Javascript
angularjs封装bootstrap时间插件datetimepicker
2016/06/20 Javascript
Javascript之深入浅出prototype
2017/02/06 Javascript
jQuery Pagination分页插件_动力节点Java学院整理
2017/07/17 jQuery
详解vue 图片上传功能
2019/04/30 Javascript
微信小程序基于Taro的分享图片功能实践详解
2019/07/12 Javascript
vue element el-transfer增加拖拽功能
2021/01/15 Vue.js
python自动安装pip
2014/04/24 Python
python字典多条件排序方法实例
2014/06/30 Python
python读取视频流提取视频帧的两种方法
2020/10/22 Python
python 多维切片之冒号和三个点的用法介绍
2018/04/19 Python
基于python实现聊天室程序
2018/07/27 Python
python调用百度REST API实现语音识别
2018/08/30 Python
Django之Mode的外键自关联和引用未定义的Model方法
2018/12/15 Python
python删除文件夹下相同文件和无法打开的图片
2019/07/16 Python
python Django 创建应用过程图示详解
2019/07/29 Python
python opencv实现证件照换底功能
2019/08/19 Python
python zip()函数使用方法解析
2019/10/31 Python
Python连接Hadoop数据中遇到的各种坑(汇总)
2020/04/14 Python
python数据抓取3种方法总结
2021/02/07 Python
pip install命令安装扩展库整理
2021/03/02 Python
如何用canvas实现在线签名的示例代码
2018/07/10 HTML / CSS
雷朋巴西官方商店:Ray-Ban Brasil
2020/07/21 全球购物
初中语文教学反思
2014/02/02 职场文书
辅导员评语
2014/05/04 职场文书
渠道运营商合作协议书范本
2014/10/06 职场文书
岳庙导游词
2015/02/04 职场文书
学生保证书格式
2015/02/27 职场文书