Python字符编码判断方法分析


Posted in Python onJuly 01, 2016

本文实例讲述了Python字符编码判断方法。分享给大家供大家参考,具体如下:

方法一:

isinstance(s, str) 用来判断是否为一般字符串
isinstance(s, unicode) 用来判断是否为unicode

if type(str).__name__!="unicode":
str=unicode(str,"utf-8")
else:
pass

方法二:

Python chardet 字符编码判断

使用 chardet 可以很方便的实现字符串/文件的编码检测。尤其是中文网页,有的页面使用GBK/GB2312,有的使用UTF8,如果你需要去爬一些页面,知道网页编码很重要的,虽然HTML页面有charset标签,但是有些时候是不对的。那么chardet就能帮我们大忙了。

chardet实例

>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
>>>chardet可以直接用detect函数来检测所给字符的编码。函数返回值为字典,有2个元数,一个是检测的可信度,另外一个就是检测到的编码。

chardet 安装

下载chardet后,解压chardet压缩包,直接将chardet文件夹放在应用程序目录下,就可以使用import chardet开始使用chardet了。

或者使用setup.py安装文件,将chardet拷贝到Python系统目录下,这样你所有的python程序只要用import chardet就可以了。

python setup.py install参考

chardet官网:http://chardet.feedparser.org/
chardet下载页面:http://chardet.feedparser.org/download/

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python Django连接MySQL数据库做增删改查
Nov 07 Python
Python 判断是否为质数或素数的实例
Oct 30 Python
Python中turtle作图示例
Nov 15 Python
一些Centos Python 生产环境的部署命令(推荐)
May 07 Python
解决Pycharm无法import自己安装的第三方module问题
May 18 Python
基于Pandas读取csv文件Error的总结
Jun 15 Python
Python3 Tkinter选择路径功能的实现方法
Jun 14 Python
Python lambda表达式filter、map、reduce函数用法解析
Sep 11 Python
python中的数组赋值与拷贝的区别详解
Nov 26 Python
pandas.DataFrame.drop_duplicates 用法介绍
Jul 06 Python
python 动态渲染 mysql 配置文件的示例
Nov 20 Python
python中字符串String及其常见操作指南(方法、函数)
Apr 06 Python
Android模拟器无法启动,报错:Cannot set up guest memory ‘android_arm’ Invalid argument的解决方法
Jul 01 #Python
python在Windows下安装setuptools(easy_install工具)步骤详解
Jul 01 #Python
python抓取并保存html页面时乱码问题的解决方法
Jul 01 #Python
python处理html转义字符的方法详解
Jul 01 #Python
python简单读取大文件的方法
Jul 01 #Python
python编码总结(编码类型、格式、转码)
Jul 01 #Python
Python编码类型转换方法详解
Jul 01 #Python
You might like
据说是雅虎的一份PHP面试题附答案
2009/01/07 PHP
php设计模式 Observer(观察者模式)
2011/06/26 PHP
php删除与复制文件夹及其文件夹下所有文件的实现代码
2013/01/23 PHP
PHP实现关键字搜索后描红功能示例
2019/07/03 PHP
Javascript & DHTML 实例编程(教程)DOM基础和基本API
2007/06/02 Javascript
jQuery Tools tab使用介绍
2012/07/14 Javascript
javascript 判断字符串是否包含某字符串及indexOf使用示例
2013/10/18 Javascript
jquery插件推荐浏览器嗅探userAgent
2014/11/09 Javascript
JavaScript中的console.assert()函数介绍
2014/12/29 Javascript
封装属于自己的JS组件
2016/01/27 Javascript
JavaScript仿商城实现图片广告轮播实例代码
2016/02/06 Javascript
JavaScript必知必会(二) null 和undefined
2016/06/08 Javascript
强大Vue.js组件浅析
2016/09/12 Javascript
ES6新特征数字、数组、字符串
2016/10/01 Javascript
js鼠标移动时禁止选中文字
2017/02/19 Javascript
js 数字、字符串、布尔值的转换方法(必看)
2017/04/07 Javascript
Angular2自定义分页组件
2017/04/19 Javascript
Easyui Datagrid自定义按钮列(最后面的操作列)
2017/07/13 Javascript
利用d3.js力导布局绘制资源拓扑图实例教程
2019/01/08 Javascript
javascript中join方法实例讲解
2019/02/21 Javascript
JavaScript字符串转数字的简单实现方法
2020/11/27 Javascript
[03:41]DOTA2上海特锦赛小组赛第三日recap精彩回顾
2016/02/28 DOTA
Python random模块(获取随机数)常用方法和使用例子
2014/05/13 Python
DJANGO-ALLAUTH社交用户系统的安装配置
2014/11/18 Python
Python制作CSDN免积分下载器
2015/03/10 Python
pygame实现弹球游戏
2020/04/14 Python
python实现猜拳游戏项目
2020/11/30 Python
深入浅析css3 中display box使用方法
2015/11/25 HTML / CSS
HTML5 body设置自适应全屏
2020/05/07 HTML / CSS
速比涛英国官网:Speedo英国
2019/07/15 全球购物
给实习单位的感谢信
2014/02/01 职场文书
《一本男孩子必读的书》教学反思
2014/02/19 职场文书
Apache Calcite 实现方言转换的代码
2021/04/24 Servers
Java 将PPT幻灯片转为HTML文件的实现思路
2021/06/11 Java/Android
《游戏王:大师决斗》将推出新卡牌包4月4日上线
2022/03/31 其他游戏
MySQL数据库实验实现简单数据库应用系统设计
2022/06/21 MySQL