python 获取网页编码方式实现代码


Posted in Python onMarch 11, 2017

python 获取网页编码方式实现代码

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

 然后import chardet

下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。

import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url)

上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python实现检测服务器是否可以ping通的2种方法
Jan 01 Python
Python中的is和id用法分析
Jan 26 Python
Python实现嵌套列表及字典并按某一元素去重复功能示例
Nov 30 Python
python3利用smtplib通过qq邮箱发送邮件方法示例
Dec 03 Python
在Python中输入一个以空格为间隔的数组方法
Nov 13 Python
python实现将多个文件分配到多个文件夹的方法
Jan 07 Python
python写日志文件操作类与应用示例
Jul 01 Python
10行Python代码计算汽车数量的实现方法
Oct 23 Python
Python实现元素等待代码实例
Nov 11 Python
python微信公众号开发简单流程实现
Mar 09 Python
用python给csv里的数据排序的具体代码
Jul 17 Python
Python爬虫基础之初次使用scrapy爬虫实例
Jun 26 Python
python 爬虫出现403禁止访问错误详解
Mar 11 #Python
Python如何读取MySQL数据库表数据
Mar 11 #Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 #Python
Python搭建HTTP服务器和FTP服务器
Mar 09 #Python
开源Web应用框架Django图文教程
Mar 09 #Python
Python运算符重载详解及实例代码
Mar 07 #Python
利用Python中的pandas库对cdn日志进行分析详解
Mar 07 #Python
You might like
php+jquery编码方面的一些心得(utf-8 gb2312)
2010/10/12 PHP
php中的路径问题与set_include_path使用介绍
2014/02/11 PHP
php中单个数据库字段多列显示(单字段分页、横向输出)
2014/07/28 PHP
PHP+Mysql+jQuery文件下载次数统计实例讲解
2015/10/10 PHP
php处理抢购类功能的高并发请求
2018/02/08 PHP
PHP面向对象五大原则之接口隔离原则(ISP)详解
2018/04/04 PHP
JS和JQ的event对象区别分析
2014/11/24 Javascript
JavaScript 学习笔记之变量及其作用域
2015/01/14 Javascript
JavaScript实现的类字典插入或更新方法实例
2015/07/10 Javascript
jQuery实现遍历复选框的方法示例
2017/03/06 Javascript
AngularJS实现页面定时刷新
2017/03/14 Javascript
Nodejs实现爬虫抓取数据实例解析
2018/07/05 NodeJs
Vue.js的复用组件开发流程完整记录
2018/11/29 Javascript
小程序组件之自定义顶部导航实例
2019/06/12 Javascript
解决layui富文本编辑器图片上传无法回显的问题
2019/09/18 Javascript
[02:04]2016国际邀请赛中国区预选赛VG.R晋级之路
2016/07/01 DOTA
pandas数据分组和聚合操作方法
2018/04/11 Python
Python中利用xpath解析HTML的方法
2018/05/14 Python
利用python提取wav文件的mfcc方法
2019/01/09 Python
python pygame实现方向键控制小球
2019/05/17 Python
Python自动抢红包教程详解
2019/06/11 Python
flask框架路由常用定义方式总结
2019/07/23 Python
基于python分析你的上网行为 看看你平时上网都在干嘛
2019/08/13 Python
Python 炫技操作之合并字典的七种方法
2020/04/10 Python
Django --Xadmin 判断登录者身份实例
2020/07/03 Python
解决运行django程序出错问题 'str'object has no attribute'_meta'
2020/07/15 Python
html5 CSS过度-webkit-transition使用介绍
2013/07/02 HTML / CSS
几个Shell Script面试题
2014/04/18 面试题
《火烧云》教学反思
2014/04/12 职场文书
新教师培训方案
2014/06/08 职场文书
学校安全生产月活动总结
2014/07/05 职场文书
市级绿色学校申报材料
2014/08/25 职场文书
2015届本科毕业生自我鉴定
2014/09/27 职场文书
志愿者个人总结
2015/03/03 职场文书
2015年安全员工作总结范文
2015/04/22 职场文书
CSS3 实现的图片悬停的切换按钮
2021/04/13 HTML / CSS