Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python和perl实现批量对目录下电子书文件重命名的代码分享
Nov 21 Python
Django中更新多个对象数据与删除对象的方法
Jul 17 Python
python创建列表并给列表赋初始值的方法
Jul 28 Python
解决uWSGI的编码问题详解
Mar 24 Python
速记Python布尔值
Nov 09 Python
python 集合 并集、交集 Series list set 转换的实例
May 29 Python
Windows下将Python文件打包成.EXE可执行文件的方法
Aug 03 Python
Pycharm设置去除显示的波浪线方法
Oct 28 Python
python mysql断开重连的实现方法
Jul 26 Python
wxPython:python首选的GUI库实例分享
Oct 05 Python
在 Jupyter 中重新导入特定的 Python 文件(场景分析)
Oct 27 Python
tensorflow之变量初始化(tf.Variable)使用详解
Feb 06 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
解析PHP实现下载文件的两种方法
2013/07/05 PHP
PHP 获取文件权限函数介绍
2013/07/11 PHP
linux下实现定时执行php脚本
2015/02/13 PHP
PHP计算指定日期所在周的开始和结束日期的方法
2015/03/24 PHP
PHP中异常处理的一些方法整理
2015/07/03 PHP
学习php设计模式 php实现观察者模式(Observer)
2015/12/09 PHP
简单谈谈PHP面向对象之标识对象
2017/06/27 PHP
PHP实现登录验证码校验功能
2018/05/17 PHP
数据结构之利用PHP实现二分搜索树
2020/10/25 PHP
js用Date对象处理时间实现思路及代码
2013/01/31 Javascript
javascript使用switch case实现动态改变超级链接文字及地址
2014/12/16 Javascript
Javascript URI 解析介绍
2015/03/15 Javascript
jquery事件绑定解绑机制源码解析
2016/09/19 Javascript
JQuery Dialog对话框 不能通过Esc关闭的原因分析及解决办法
2017/01/18 Javascript
JavaScript获取中英文混合字符串长度的方法示例
2017/02/04 Javascript
基于vue的fullpage.js单页滚动插件
2017/03/20 Javascript
简单实现js上传文件功能
2017/08/21 Javascript
vue做网页开场视频的实例代码
2017/10/20 Javascript
ReactNative实现Toast的示例
2017/12/31 Javascript
如何用JS模拟实现数组的map方法
2020/07/30 Javascript
JavaScript中变量提升和函数提升的详解
2020/08/07 Javascript
[52:02]完美世界DOTA2联赛PWL S2 FTD.C vs SZ 第一场 11.27
2020/11/30 DOTA
python assert的用处示例详解
2019/04/01 Python
使用 prometheus python 库编写自定义指标的方法(完整代码)
2020/06/29 Python
基于python获取本地时间并转换时间戳和日期格式
2020/10/27 Python
俄罗斯在线手表和珠宝商店:AllTime
2019/09/28 全球购物
环境科学专业优秀毕业生自荐书
2014/02/03 职场文书
优秀广告词大全
2014/03/19 职场文书
法人代表授权委托书
2014/04/08 职场文书
留守儿童工作方案
2014/06/02 职场文书
车间统计员岗位职责
2015/04/14 职场文书
借条如何写
2015/05/26 职场文书
学雷锋感言
2015/08/03 职场文书
python numpy中multiply与*及matul 的区别说明
2021/05/26 Python
SpringBoot实现异步事件驱动的方法
2021/06/28 Java/Android
Nginx虚拟主机的搭建的实现步骤
2022/01/18 Servers