Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python读写配置文件的方法
Jun 03 Python
python字典的常用操作方法小结
May 16 Python
Zabbix实现微信报警功能
Oct 09 Python
给你选择Python语言实现机器学习算法的三大理由
Nov 15 Python
python中in在list和dict中查找效率的对比分析
May 04 Python
Python实现的简单线性回归算法实例分析
Dec 26 Python
Python中使用__new__实现单例模式并解析
Jun 25 Python
django页面跳转问题及注意事项
Jul 18 Python
face++与python实现人脸识别签到(考勤)功能
Aug 28 Python
Python OrderedDict字典排序方法详解
May 21 Python
实例代码讲解Python 线程池
Aug 24 Python
python 实现学生信息管理系统的示例
Nov 28 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
PHP5中实现多态的两种方法实例分享
2014/04/21 PHP
实例详解PHP中html word 互转的方法
2016/01/28 PHP
php使用redis的几种常见操作方式和用法示例
2020/02/20 PHP
IE浏览器PNG图片透明效果代码
2008/09/02 Javascript
$(document).ready(function() {})不执行初始化脚本
2014/06/19 Javascript
jQuery动态创建html元素的常用方法汇总
2014/09/05 Javascript
JavaScript使用ActiveXObject访问Access和SQL Server数据库
2015/04/02 Javascript
JavaScript中实现Map的示例代码
2015/09/09 Javascript
JavaScript中的boolean布尔值使用学习及相关技巧讲解
2016/05/26 Javascript
jQuery操作iframe中js函数的方法小结
2016/07/06 Javascript
vue实现word,pdf文件的导出功能
2018/07/31 Javascript
解决Layui选择全部,换页checkbox复选框重新勾选的问题方法
2018/08/14 Javascript
JavaScript fetch接口案例解析
2018/08/30 Javascript
vue-router重定向和路由别名的使用讲解
2019/01/19 Javascript
jQuery实现的五星点评功能【案例】
2019/02/18 jQuery
vue中使用极验验证码的方法(附demo)
2019/12/04 Javascript
node.JS二进制操作模块buffer对象使用方法详解
2020/02/06 Javascript
开发Node CLI构建微信小程序脚手架的示例
2020/03/27 Javascript
Vue 数据响应式相关总结
2021/01/28 Vue.js
Python实现的文本简单可逆加密算法示例
2017/05/18 Python
python打包压缩、读取指定目录下的指定类型文件
2018/04/12 Python
Python3.6日志Logging模块简单用法示例
2018/06/14 Python
Python实现的旋转数组功能算法示例
2019/02/23 Python
python通过文本在一个图中画多条线的实例
2020/02/21 Python
使用html5新特性轻松监听任何App自带返回键的示例
2018/03/13 HTML / CSS
专门出售各种儿童读物的网站:Put Me In The Story
2016/08/07 全球购物
Coach澳大利亚官方网站:美国著名时尚奢侈品牌
2017/05/24 全球购物
微软瑞士官方网站:Microsoft瑞士
2018/04/20 全球购物
男女钓鱼靴和甲板鞋:XTRATUF
2021/01/09 全球购物
应届毕业生求职自荐书
2014/01/03 职场文书
小学生综合素质评语
2014/04/23 职场文书
好的旅游活动方案
2014/08/19 职场文书
小学生民族团结演讲稿
2014/08/27 职场文书
2015年社区宣传工作总结
2015/05/20 职场文书
队列队形口号
2015/12/25 职场文书
优秀创业计划书分享
2019/07/19 职场文书