Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python django集成cas验证系统
Jul 14 Python
python中enumerate的用法实例解析
Aug 18 Python
Python使用plotly绘制数据图表的方法
Jul 18 Python
Python探索之URL Dispatcher实例详解
Oct 28 Python
利用python3随机生成中文字符的实现方法
Nov 24 Python
Python利用正则表达式实现计算器算法思路解析
Apr 25 Python
python 对字典按照value进行排序的方法
May 09 Python
django 中QuerySet特性功能详解
Jul 25 Python
解决django接口无法通过ip进行访问的问题
Mar 27 Python
Python通过两个dataframe用for循环求笛卡尔积
Apr 29 Python
使用python如何删除同一文件夹下相似的图片
May 07 Python
Python用tkinter实现自定义记事本的方法详解
Mar 31 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
用PHP产生动态的影像图
2006/10/09 PHP
php 对输入信息的进行安全过滤的函数代码
2012/06/29 PHP
php中把美国时间转为北京时间的自定义函数分享
2014/07/28 PHP
Laravel框架路由和控制器的绑定操作方法
2018/06/12 PHP
Js+XML 操作
2006/09/20 Javascript
菜鸟javascript基础资料整理3 正则
2010/12/06 Javascript
js 页面关闭前的出现提示的实现代码
2011/05/25 Javascript
Jquery 实现checkbox全选方法
2015/01/28 Javascript
使用jQuery获得内容以及内容的属性
2015/02/26 Javascript
jquery实现的美女拼图游戏实例
2015/05/04 Javascript
微信小程序 教程之WXML
2016/10/18 Javascript
jQuery插件版本冲突的处理方法分析
2017/01/16 Javascript
JS操作xml对象转换为Json对象示例
2017/03/25 Javascript
详细分析JS函数去抖和节流
2017/12/05 Javascript
vue如何安装使用Quill富文本编辑器
2018/09/21 Javascript
微信小程序中为什么使用var that=this
2019/08/27 Javascript
Python调用微信公众平台接口操作示例
2017/07/08 Python
Python实现利用最大公约数求三个正整数的最小公倍数示例
2017/09/30 Python
Numpy数组转置的两种实现方法
2018/04/17 Python
Python实现的对本地host127.0.0.1主机进行扫描端口功能示例
2019/02/15 Python
使用python将mysql数据库的数据转换为json数据的方法
2019/07/01 Python
Django获取应用下的所有models的例子
2019/08/30 Python
基于Python实现人脸自动戴口罩系统
2020/02/06 Python
解决Python3.8运行tornado项目报NotImplementedError错误
2020/09/02 Python
python如何修改文件时间属性
2021/02/05 Python
Python对excel的基本操作方法
2021/02/18 Python
使用CSS3创建动态菜单效果
2015/07/10 HTML / CSS
美国Randolph太阳镜官网:美国制造的飞行员太阳镜和射击眼镜
2018/06/15 全球购物
公司门卫管理制度
2014/02/01 职场文书
毕业自我鉴定怎么写
2014/03/25 职场文书
《云房子》教学反思
2014/04/20 职场文书
2015质检员个人年终工作总结
2015/10/23 职场文书
2016年法制宣传月活动总结
2016/04/01 职场文书
goland设置颜色和字体的操作
2021/05/05 Golang
无线电通信名词解释
2022/02/18 无线电
Nginx开源可视化配置工具NginxConfig使用教程
2022/06/21 Servers