Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Mac下Supervisor进程监控管理工具的安装与配置
Dec 16 Python
wxPython使用系统剪切板的方法
Jun 16 Python
Python实现配置文件备份的方法
Jul 30 Python
Python实现统计代码行的方法分析
Jul 12 Python
python 对dataframe下面的值进行大规模赋值方法
Jun 09 Python
python numpy和list查询其中某个数的个数及定位方法
Jun 27 Python
python正则表达式之对号入座篇
Jul 24 Python
详解python如何在django中为用户模型添加自定义权限
Oct 15 Python
DJANGO-URL反向解析REVERSE实例讲解
Oct 25 Python
浅谈Django中的QueryDict元素为数组的坑
Mar 31 Python
python利用pytesseract 实现本地识别图片文字
Dec 14 Python
PyQt5通过信号实现MVC的示例
Feb 06 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
基于qmail的完整WEBMAIL解决方案安装详解
2006/10/09 PHP
PHP文本操作类
2006/11/25 PHP
php curl上传、下载、https登陆实现代码
2017/07/23 PHP
thinkphp框架类库扩展操作示例
2019/11/26 PHP
发现的以前不知道的函数
2006/09/19 Javascript
ExtJS 2.0实用简明教程 之ExtJS版的Hello
2009/04/29 Javascript
需要做特殊处理的DOM元素属性的访问
2010/11/05 Javascript
JavaScript异步回调的Promise模式封装实例
2014/06/07 Javascript
用JavaScript实现页面重定向功能的教程
2015/06/04 Javascript
javascript中递归函数用法注意点
2015/07/30 Javascript
jQuery实现的Tab滑动选项卡及图片切换(多种效果)小结
2015/09/14 Javascript
使用Curl命令查看请求响应时间方法
2016/11/04 Javascript
web前端vue之CSS过渡效果示例
2018/01/10 Javascript
Nodejs模块载入运行原理
2018/02/23 NodeJs
细说Vue组件的服务器端渲染的过程
2019/05/30 Javascript
0基础学习前端开发的一些建议
2020/07/14 Javascript
[32:26]EG vs IG 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
查看Python安装路径以及安装包路径小技巧
2015/04/28 Python
Python中处理字符串之islower()方法的使用简介
2015/05/19 Python
Python错误: SyntaxError: Non-ASCII character解决办法
2017/06/08 Python
pandas去重复行并分类汇总的实现方法
2019/01/29 Python
numpy库与pandas库axis=0,axis= 1轴的用法详解
2019/05/27 Python
python 正则表达式参数替换实例详解
2020/01/17 Python
Python使用20行代码实现微信聊天机器人
2020/06/05 Python
Python如何telnet到网络设备
2021/02/18 Python
CSS3径向渐变之大鱼吃小鱼之孤单的大鱼
2016/04/26 HTML / CSS
工厂厂长岗位职责
2013/11/08 职场文书
编辑找工作求职信分享
2014/01/03 职场文书
中学生期中自我鉴定
2014/04/20 职场文书
室内趣味活动方案
2014/08/24 职场文书
公司安全管理制度范本
2015/08/05 职场文书
小学信息技术教学反思
2016/02/16 职场文书
《语言的突破》读后感3篇
2019/12/12 职场文书
Python如何把不同类型数据的json序列化
2021/04/30 Python
判断Python中的Nonetype类型
2021/05/25 Python
JS开发前端团队展示控制器来为成员引流
2022/08/14 Javascript