python 获取网页编码方式实现代码


Posted in Python onMarch 11, 2017

python 获取网页编码方式实现代码

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

 然后import chardet

下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。

import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url)

上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
跟老齐学Python之做一个小游戏
Sep 28 Python
Python中的super用法详解
May 28 Python
python采用django框架实现支付宝即时到帐接口
May 17 Python
Python3 XML 获取雅虎天气的实现方法
Feb 01 Python
Python实现检测文件MD5值的方法示例
Apr 11 Python
详解Python 调用C# dll库最简方法
Jun 20 Python
Django后端发送小程序微信模板消息示例(服务通知)
Dec 17 Python
详解django中Template语言
Feb 22 Python
解决matplotlib.pyplot在Jupyter notebook中不显示图像问题
Apr 22 Python
解决IDEA 的 plugins 搜不到任何的插件问题
May 04 Python
Django xadmin安装及使用详解
Oct 26 Python
关于python中模块和重载的问题
Nov 02 Python
python 爬虫出现403禁止访问错误详解
Mar 11 #Python
Python如何读取MySQL数据库表数据
Mar 11 #Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 #Python
Python搭建HTTP服务器和FTP服务器
Mar 09 #Python
开源Web应用框架Django图文教程
Mar 09 #Python
Python运算符重载详解及实例代码
Mar 07 #Python
利用Python中的pandas库对cdn日志进行分析详解
Mar 07 #Python
You might like
php自动跳转中英文页面
2008/07/29 PHP
PHP缩略图等比例无损压缩,可填充空白区域补充色
2011/06/10 PHP
php常用Stream函数集介绍
2013/06/24 PHP
php利用curl抓取新浪微博内容示例
2014/04/27 PHP
php将远程图片保存到本地服务器的实现代码
2015/08/03 PHP
php 无限分类 树形数据格式化代码
2016/10/11 PHP
javascript 进度条 实现代码
2009/07/30 Javascript
用JavaScript将从数据库中读取出来的日期型格式化为想要的类型。
2009/08/15 Javascript
js getElementsByTagName的简写方式
2010/06/27 Javascript
jQuery1.6 使用方法二
2011/11/23 Javascript
JQuery为textarea添加maxlength属性并且兼容IE
2013/04/25 Javascript
js获取日期:昨天今天和明天、后天
2014/06/11 Javascript
JavaScript定义变量和变量优先级问题探讨
2014/10/11 Javascript
开启Javascript中apply、call、bind的用法之旅模式
2015/10/28 Javascript
简单讲解jQuery中的子元素过滤选择器
2016/04/18 Javascript
用JS写的一个Ajax库(实例代码)
2016/08/06 Javascript
jquery根据一个值来选中select下的option实例代码
2016/08/29 Javascript
Vue.js快速入门实例教程
2016/10/15 Javascript
详解React-Native解决键盘遮挡问题(Keyboard遮挡问题)
2017/07/13 Javascript
浅谈webpack+react多页面开发终极架构
2018/11/11 Javascript
使用 Opentype.js 生成字体子集的实例代码详解
2020/05/25 Javascript
基于Django URL传参 FORM表单传数据 get post的用法实例
2018/05/28 Python
python 对xml解析的示例
2021/02/27 Python
CSS3制作圆形滚动进度条动画的示例
2020/11/05 HTML / CSS
html2canvas生成清晰的图片实现打印的示例代码
2019/09/30 HTML / CSS
中国电子产品外贸网站:MiniIntheBox
2017/02/06 全球购物
Lee牛仔裤澳大利亚官网:美国著名牛仔裤品牌
2017/09/02 全球购物
犹他州最古老的体育用品公司:Al’s
2020/12/18 全球购物
暑假实习求职信范文
2013/09/22 职场文书
网络技术专业推荐信
2014/02/20 职场文书
资料员岗位职责
2015/02/10 职场文书
2015年财务部年度工作总结
2015/05/19 职场文书
八年级作文之感恩
2019/11/22 职场文书
简述Java中throw-throws异常抛出
2021/08/07 Java/Android
Win11 21h2可以升级22h2吗?看看你的电脑符不符合要求
2022/07/07 数码科技
js作用域及作用域链工作引擎
2022/07/07 Javascript