python处理中文编码和判断编码示例


Posted in Python onFebruary 26, 2014

下面所说的都是针对python2.7

#coding:utf-8
#chardet 需要下载安装
import chardet
#抓取网页html
line = "http://www.***.com"
html_1 = urllib2.urlopen(line,timeout=120).read()
#print html_1
encoding_dict = chardet.detect(html_1)
#print encoding
web_encoding = encoding_dict['encoding']
if web_encoding == 'utf-8' or web_encoding == 'UTF-8':
  html = html_1
else :
   html = html_1.decode('gbk','ignore').encode('utf-8')
#有以上处理,整个html就不会是乱码。
Python 相关文章推荐
Python内置函数dir详解
Apr 14 Python
Python守护进程用法实例分析
Jun 04 Python
Python实现定时任务
Feb 08 Python
python pandas中DataFrame类型数据操作函数的方法
Apr 08 Python
python和pygame实现简单俄罗斯方块游戏
Feb 19 Python
python发送告警邮件脚本
Sep 17 Python
Python基于聚类算法实现密度聚类(DBSCAN)计算【测试可用】
Dec 26 Python
谈谈Python中的while循环语句
Mar 10 Python
用Cython加速Python到“起飞”(推荐)
Aug 01 Python
python下PyGame的下载与安装过程及遇到问题
Aug 04 Python
pytorch GAN生成对抗网络实例
Jan 10 Python
Mac PyCharm中的.gitignore 安装设置教程
Apr 16 Python
python实现网页链接提取的方法分享
Feb 25 #Python
python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签到)
Feb 24 #Python
python实现socket客户端和服务端简单示例
Feb 24 #Python
python抓取网页内容示例分享
Feb 24 #Python
使用python装饰器验证配置文件示例
Feb 24 #Python
python通过urllib2爬网页上种子下载示例
Feb 24 #Python
python控制台显示时钟的示例
Feb 24 #Python
You might like
php框架Phpbean说明
2008/01/10 PHP
让PHP支持断点续传的源码
2010/05/16 PHP
PHP写的获取各搜索蜘蛛爬行记录代码
2012/08/21 PHP
php返回字符串中所有单词的方法
2015/03/09 PHP
基于php的微信公众平台开发入门实例
2015/04/15 PHP
smarty学习笔记之常见代码段用法总结
2016/03/19 PHP
PHP连接MySQL进行增、删、改、查操作
2017/02/19 PHP
PHP CURL中传递cookie的方法步骤
2019/05/09 PHP
PHP 7.4 新语法之箭头函数实例详解
2019/05/09 PHP
一个刚完成的layout(拖动流畅,不受iframe影响)
2007/08/17 Javascript
JavaScript 版本自动生成文章摘要
2008/07/23 Javascript
基于jQuery架构javascript基础体系
2011/01/01 Javascript
javascript中window.event事件用法详解
2012/12/11 Javascript
js验证真实姓名与身份证号,手机号的简单实例
2016/07/18 Javascript
JavaScript 数组的深度复制解析
2016/11/02 Javascript
JSON 数据详解及实例代码分析
2017/01/20 Javascript
vue.js从安装到搭建过程详解
2017/03/17 Javascript
angular学习之从零搭建一个angular4.0项目
2017/07/10 Javascript
VueJs 将接口用webpack代理到本地的方法
2017/11/27 Javascript
js中getBoundingClientRect的作用及兼容方案详解
2018/02/01 Javascript
webpack@v4升级踩坑(小结)
2018/10/08 Javascript
独立部署小程序基于nodejs的服务器过程详解
2019/06/24 NodeJs
小程序实现搜索框功能
2020/03/26 Javascript
微信小程序实现多行文字超出部分省略号显示功能
2019/10/23 Javascript
Python实现朴素贝叶斯分类器的方法详解
2018/07/04 Python
python时间与Unix时间戳相互转换方法详解
2020/02/13 Python
巧用HTML5给按钮背景设计不同的动画简单实例
2016/08/09 HTML / CSS
俄罗斯香水和化妆品购物网站:Л’Этуаль
2018/05/10 全球购物
联想新西兰官方网站:Lenovo New Zealand
2018/10/30 全球购物
澳大利亚最超值的自行车之家:Reid Cycles
2019/03/24 全球购物
解释一下ruby中的特殊方法与特殊类
2013/02/26 面试题
个人自我鉴定范文
2013/10/04 职场文书
创业计划书中要认真思考的问题
2013/12/28 职场文书
2014第二批党员干部对照“四风”找差距检查材料思想汇报
2014/09/18 职场文书
股东大会通知
2015/04/24 职场文书
MySQL性能指标TPS+QPS+IOPS压测
2022/08/05 MySQL