Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python中模拟enum枚举类型的5种方法分享
Nov 22 Python
Python中的自省(反射)详解
Jun 02 Python
Python 爬虫之超链接 url中含有中文出错及解决办法
Aug 03 Python
使用Python写一个量化股票提醒系统
Aug 22 Python
python使用matplotlib库生成随机漫步图
Aug 27 Python
对pandas将dataframe中某列按照条件赋值的实例讲解
Nov 29 Python
在python中使用requests 模拟浏览器发送请求数据的方法
Dec 26 Python
pycharm配置当鼠标悬停时快速提示方法参数
Jul 31 Python
python或C++读取指定文件夹下的所有图片
Aug 31 Python
Python 异常的捕获、异常的传递与主动抛出异常操作示例
Sep 23 Python
pytorch判断是否cuda 判断变量类型方式
Jun 23 Python
python实现KNN近邻算法
Dec 30 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
社区(php&&mysql)三
2006/10/09 PHP
PHP set_time_limit(0)长连接的实现分析
2010/03/02 PHP
ThinkPHP模型详解
2015/07/27 PHP
PHP使用PhpSpreadsheet操作Excel实例详解
2020/03/26 PHP
Jquery动态添加及删除页面节点元素示例代码
2014/06/16 Javascript
jQuery使用removeClass方法删除元素指定Class的方法
2015/03/26 Javascript
用JavaScript实现对话框的教程
2015/06/04 Javascript
JavaScript创建闭包的两种方式的优劣与区别分析
2015/06/22 Javascript
原生javascript实现图片无缝滚动效果
2016/02/12 Javascript
jquery 删除节点 添加节点 找兄弟节点的简单实现
2016/12/07 Javascript
React创建组件的三种方式及其区别
2017/01/12 Javascript
Angular2关于@angular/cli默认端口号配置的问题
2017/07/15 Javascript
javascript编程开发中取色器及封装$函数用法示例
2017/08/09 Javascript
JavaScript面向对象精要(上部)
2017/09/12 Javascript
vue中使用refs定位dom出现undefined的解决方法
2017/12/21 Javascript
webpack4.0打包优化策略整理小结
2018/03/30 Javascript
JavaScript Canvas编写炫彩的网页时钟
2019/10/16 Javascript
小程序实现录音上传功能
2019/11/22 Javascript
JavaScript实现点击切换验证码及校验
2021/01/10 Javascript
[04:15]DOTA2-DPC中国联赛1月19日Recap集锦
2021/03/11 DOTA
python for 循环获取index索引的方法
2019/02/01 Python
在vscode中配置python环境过程解析
2019/09/28 Python
tensorflow使用指定gpu的方法
2020/02/04 Python
windows10 pycharm下安装pyltp库和加载模型实现语义角色标注的示例代码
2020/05/07 Python
Python偏函数实现原理及应用
2020/11/20 Python
利于python脚本编写可视化nmap和masscan的方法
2020/12/29 Python
荷兰照明、灯具和配件网上商店:dmlights
2019/08/25 全球购物
Mountain Hardwear官网:攀岩服装和户外装备
2019/09/26 全球购物
建筑公司文秘岗位职责
2013/11/29 职场文书
销售经理工作职责范文
2013/12/03 职场文书
yy结婚证婚词
2014/01/10 职场文书
村党支部公开承诺书
2014/05/29 职场文书
工艺技术员岗位职责
2015/02/04 职场文书
信息简报范文
2015/07/21 职场文书
2016元旦主持人经典开场白台词
2015/12/03 职场文书
护理心得体会范文
2016/01/22 职场文书