python 获取网页编码方式实现代码


Posted in Python onMarch 11, 2017

python 获取网页编码方式实现代码

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

 然后import chardet

下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。

import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url)

上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
编写Python爬虫抓取暴走漫画上gif图片的实例分享
Apr 20 Python
Python中functools模块的常用函数解析
Jun 30 Python
Python实现的json文件读取及中文乱码显示问题解决方法
Aug 06 Python
Python3中在Anaconda环境下安装basemap包
Oct 21 Python
Python实现KNN(K-近邻)算法的示例代码
Mar 05 Python
浅谈pytorch grad_fn以及权重梯度不更新的问题
Aug 20 Python
python数据爬下来保存的位置
Feb 17 Python
详解pandas中iloc, loc和ix的区别和联系
Mar 09 Python
Keras 使用 Lambda层详解
Jun 10 Python
读取nii或nii.gz文件中的信息即输出图像操作
Jul 01 Python
Python3使用 GitLab API 进行批量合并分支
Oct 15 Python
Python常用断言函数实例汇总
Nov 30 Python
python 爬虫出现403禁止访问错误详解
Mar 11 #Python
Python如何读取MySQL数据库表数据
Mar 11 #Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 #Python
Python搭建HTTP服务器和FTP服务器
Mar 09 #Python
开源Web应用框架Django图文教程
Mar 09 #Python
Python运算符重载详解及实例代码
Mar 07 #Python
利用Python中的pandas库对cdn日志进行分析详解
Mar 07 #Python
You might like
php面向对象全攻略 (十六) 对象的串行化
2009/09/30 PHP
ThinkPHP模板判断输出Defined标签用法详解
2014/06/30 PHP
PHP中SESSION的注销与清除
2015/04/16 PHP
PHP将整数数字转换为罗马数字实例分享
2019/03/17 PHP
PHP基础之输出缓冲区基本概念、原理分析
2019/06/19 PHP
THINKPHP5分页数据对象处理过程解析
2020/10/28 PHP
JQUERY THICKBOX弹出层插件
2008/08/30 Javascript
Js 弹出框口并返回值的两种常用方法
2010/12/30 Javascript
javascript解决innerText浏览器兼容问题思路代码
2013/05/17 Javascript
JSON无限折叠菜单编写实例
2013/12/16 Javascript
探寻Javascript执行效率问题
2014/11/12 Javascript
javascript中的Base64、UTF8编码与解码详解
2015/03/18 Javascript
jQuery插件Slider Revolution实现响应动画滑动图片切换效果
2015/06/05 Javascript
AngularJS读取JSON及XML文件的方法示例
2017/05/25 Javascript
JavaScript中使用参数个数实现重载功能
2017/09/01 Javascript
在原生不支持的旧环境中添加兼容的Object.keys实现方法
2017/09/11 Javascript
原生JS实现多个小球碰撞反弹效果示例
2018/01/31 Javascript
微信小程序自定义底部弹出框
2020/11/16 Javascript
使用D3.js构建实时图形的示例代码
2018/08/28 Javascript
koa+mongoose实现简单增删改查接口的示例代码
2019/05/13 Javascript
vue 百度地图(vue-baidu-map)绘制方向箭头折线实例代码详解
2020/04/28 Javascript
Vue 打包的静态文件不能直接运行的原因及解决办法
2020/11/19 Vue.js
Python进行数据提取的方法总结
2016/08/22 Python
Python使用SQLite和Excel操作进行数据分析
2018/01/20 Python
python简易实现任意位数的水仙花实例
2018/11/13 Python
pandas把所有大于0的数设置为1的方法
2019/01/26 Python
python爬虫开发之selenium模块详细使用方法与实例全解
2020/03/09 Python
pytorch下的unsqueeze和squeeze的用法说明
2021/02/06 Python
html5 worker 实例(二) 图片变换效果
2013/06/24 HTML / CSS
利用Storage Event实现页面间通信的示例代码
2018/07/26 HTML / CSS
Diamondback自行车:拥有你的冒险
2019/04/22 全球购物
Linux Interview Questions For software testers
2013/05/17 面试题
综合测评自我鉴定
2013/10/08 职场文书
中层干部岗位职责
2013/12/18 职场文书
农村产权制度改革实施方案
2014/03/21 职场文书
详细介绍Java中的CyclicBarrier
2022/04/13 Java/Android