python 获取网页编码方式实现代码


Posted in Python onMarch 11, 2017

python 获取网页编码方式实现代码

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

 然后import chardet

下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。

import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url)

上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python多线程编程(八):使用Event实现线程间通信
Apr 05 Python
对pandas中apply函数的用法详解
Apr 10 Python
Python从使用线程到使用async/await的深入讲解
Sep 16 Python
对python 读取线的shp文件实例详解
Dec 22 Python
如何在Django项目中引入静态文件
Jul 26 Python
django中瀑布流写法实例代码
Oct 14 Python
django实现支付宝支付实例讲解
Oct 17 Python
Python tensorflow实现mnist手写数字识别示例【非卷积与卷积实现】
Dec 19 Python
python GUI库图形界面开发之PyQt5控件QTableWidget详细使用方法与属性
Feb 25 Python
Python yield生成器和return对比代码实例
Apr 20 Python
Django利用elasticsearch(搜索引擎)实现搜索功能
Nov 26 Python
python库sklearn常用操作
Aug 23 Python
python 爬虫出现403禁止访问错误详解
Mar 11 #Python
Python如何读取MySQL数据库表数据
Mar 11 #Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 #Python
Python搭建HTTP服务器和FTP服务器
Mar 09 #Python
开源Web应用框架Django图文教程
Mar 09 #Python
Python运算符重载详解及实例代码
Mar 07 #Python
利用Python中的pandas库对cdn日志进行分析详解
Mar 07 #Python
You might like
dedecms防止FCK乱格式化你的代码的修改方法
2007/03/17 PHP
php 文件上传实例代码
2012/04/19 PHP
为PHP5.4开启Zend OPCode缓存
2014/12/26 PHP
PHP闭包定义与使用简单示例
2018/04/13 PHP
javascript 表单的友好用户体现
2009/01/07 Javascript
JavaScript 滚轮事件使用说明
2010/03/07 Javascript
基于Asp.net与Javascript控制的日期控件
2010/05/22 Javascript
jquery EasyUI的formatter格式化函数代码
2011/01/12 Javascript
基于jquery的地址栏射击游戏代码
2011/03/10 Javascript
jquery ajax 同步异步的执行 return值不能取得的解决方案
2012/01/08 Javascript
Jquery实现点击按钮,连续地向textarea中添加值的实例代码
2014/03/08 Javascript
jquery checkbox 勾选的bug问题解决方案与分析
2014/11/13 Javascript
jQuery事件绑定与解除绑定实现方法
2015/04/15 Javascript
JavaScript兼容浏览器FF/IE技巧
2016/08/14 Javascript
bootstrap提示标签、提示框实现代码
2016/12/28 Javascript
微信小程序中做用户登录与登录态维护的实现详解
2017/05/17 Javascript
详解关于react-redux中的connect用法介绍及原理解析
2017/09/11 Javascript
Nginx 配置多站点vhost 的方法
2018/01/07 Javascript
Javascript实现购物车功能的详细代码
2018/05/08 Javascript
详解微信小程序框架wepy踩坑记录(与vue对比)
2019/03/12 Javascript
ElementUI Tree 树形控件的使用并给节点添加图标
2020/02/27 Javascript
Javascript实现贪吃蛇小游戏(含详细注释)
2020/10/23 Javascript
python轻松查到删除自己的微信好友
2016/01/10 Python
教你利用Python玩转histogram直方图的五种方法
2018/07/30 Python
Python2和Python3之间的str处理方式导致乱码的讲解
2019/01/03 Python
详解Django模版中加载静态文件配置方法
2019/07/21 Python
Python自动化测试笔试面试题精选
2020/03/12 Python
PyQt5.6+pycharm配置以及pyinstaller生成exe(小白教程)
2020/06/02 Python
python使用matplotlib的savefig保存时图片保存不完整的问题
2021/01/08 Python
python自动生成证件号的方法示例
2021/01/14 Python
CSS3实现的文本3D效果附图
2014/09/03 HTML / CSS
琳达·法罗眼镜英国官网:Linda Farrow英国
2021/01/19 全球购物
电子商务专业毕业生自荐书
2014/06/22 职场文书
自主招生专家推荐信
2015/03/26 职场文书
python 算法题——快乐数的多种解法
2021/05/27 Python
大脑的记忆过程在做数据压缩,不同图形也有共同的记忆格式
2022/04/29 数码科技