python 获取网页编码方式实现代码


Posted in Python onMarch 11, 2017

python 获取网页编码方式实现代码

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

 然后import chardet

下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。

import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url)

上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python读取图片EXIF信息类库介绍和使用实例
Jul 10 Python
介绍Python的Django框架中的静态资源管理器django-pipeline
Apr 25 Python
Python cookbook(数据结构与算法)在字典中将键映射到多个值上的方法
Feb 18 Python
python 获取字符串MD5值方法
May 29 Python
Anaconda 离线安装 python 包的操作方法
Jun 11 Python
python实现本地图片转存并重命名的示例代码
Oct 27 Python
python实现随机漫步方法和原理
Jun 10 Python
解决python3 安装不了PIL的问题
Aug 16 Python
Python模块的定义,模块的导入,__name__用法实例分析
Jan 07 Python
flask利用flask-wtf验证上传的文件的方法
Jan 17 Python
用python实现一个简单的验证码
Dec 09 Python
Python实现自动整理文件的脚本
Dec 17 Python
python 爬虫出现403禁止访问错误详解
Mar 11 #Python
Python如何读取MySQL数据库表数据
Mar 11 #Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 #Python
Python搭建HTTP服务器和FTP服务器
Mar 09 #Python
开源Web应用框架Django图文教程
Mar 09 #Python
Python运算符重载详解及实例代码
Mar 07 #Python
利用Python中的pandas库对cdn日志进行分析详解
Mar 07 #Python
You might like
php二维数组排序与默认自然排序的方法介绍
2013/04/27 PHP
PHP独立Session数据库存储操作类分享
2014/06/11 PHP
php中mail函数发送邮件失败的解决方法
2014/12/24 PHP
laravel5.5添加echarts实现画图功能的方法
2019/10/09 PHP
javascript 面向对象继承
2009/11/26 Javascript
js实时监听文本框状态的方法
2011/04/26 Javascript
JS获得QQ号码的昵称,头像,生日的简单实例
2013/12/04 Javascript
浅谈JavaScript函数参数的可修改性问题
2013/12/05 Javascript
JS使用replace()方法和正则表达式进行字符串的搜索与替换实例
2014/04/10 Javascript
网页实时显示服务器时间和javscript自运行时钟
2014/06/09 Javascript
extjs 如何给column 加上提示
2014/07/29 Javascript
Ztree新增角色和编辑角色回显问题的解决
2016/10/25 Javascript
前端构建工具之gulp的配置与搭建详解
2017/06/12 Javascript
jquery中done和then的区别(详解)
2017/12/19 jQuery
JavaScript判断日期时间差的实例代码
2018/03/01 Javascript
javascript中innerHTML 获取或替换html内容的实现代码
2020/03/17 Javascript
Python导入oracle数据的方法
2015/07/10 Python
Python虚拟环境virtualenv的安装与使用详解
2017/05/28 Python
Python把对应格式的csv文件转换成字典类型存储脚本的方法
2019/02/12 Python
Python容器使用的5个技巧和2个误区总结
2019/09/26 Python
基于python实现把图片转换成素描
2019/11/13 Python
在keras里面实现计算f1-score的代码
2020/06/15 Python
Python matplotlib图例放在外侧保存时显示不完整问题解决
2020/07/28 Python
html5构建触屏网站之网站尺寸探讨
2013/01/07 HTML / CSS
Volcom法国官网:美国冲浪滑板品牌
2017/05/25 全球购物
俄罗斯便宜的在线服装商店:GroupPrice
2020/04/10 全球购物
C语言中一个结构不能包含指向自己的指针吗
2012/05/25 面试题
大一学生假期实习的自我评价
2013/10/12 职场文书
大学生实习感言
2014/01/16 职场文书
团日活动总结范文
2014/04/25 职场文书
小摄影师教学反思
2014/04/27 职场文书
一次性工伤赔偿协议书范本
2014/11/25 职场文书
2015年幼儿园元旦亲子活动方案
2014/12/09 职场文书
计算机专业自荐信
2015/03/05 职场文书
2015年秋季学校开学标语
2015/07/16 职场文书
python制作图形界面的2048游戏, 基于tkinter
2021/04/06 Python