python 获取网页编码方式实现代码


Posted in Python onMarch 11, 2017

python 获取网页编码方式实现代码

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

 然后import chardet

下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。

import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url)

上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
Python常用内置函数总结
Feb 08 Python
python实现在每个独立进程中运行一个函数的方法
Apr 23 Python
Python3.2模拟实现webqq登录
Feb 15 Python
使用Python进行AES加密和解密的示例代码
Feb 02 Python
python使用正则表达式来获取文件名的前缀方法
Oct 21 Python
python使用Plotly绘图工具绘制柱状图
Apr 01 Python
对python tkinter窗口弹出置顶的方法详解
Jun 14 Python
python图的深度优先和广度优先算法实例分析
Oct 26 Python
在python image 中实现安装中文字体
May 16 Python
Python新手学习装饰器
Jun 04 Python
Python LMDB库的使用示例
Feb 14 Python
python爬虫beautifulsoup库使用操作教程全解(python爬虫基础入门)
Feb 19 Python
python 爬虫出现403禁止访问错误详解
Mar 11 #Python
Python如何读取MySQL数据库表数据
Mar 11 #Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 #Python
Python搭建HTTP服务器和FTP服务器
Mar 09 #Python
开源Web应用框架Django图文教程
Mar 09 #Python
Python运算符重载详解及实例代码
Mar 07 #Python
利用Python中的pandas库对cdn日志进行分析详解
Mar 07 #Python
You might like
百度地图API使用方法详解
2015/08/25 PHP
PHP使用preg_split和explode分割textarea存放内容的方法分析
2017/07/03 PHP
jQuery live( type, fn ) 委派事件实现
2009/10/11 Javascript
jQuery源码分析-01总体架构分析
2011/11/14 Javascript
jquery分割字符串的方法
2015/06/24 Javascript
vue.js使用代理和使用Nginx来解决跨域的问题
2018/02/03 Javascript
详解JavaScript对数组操作(添加/删除/截取/排序/倒序)
2019/04/28 Javascript
使用vue制作滑动标签
2019/09/21 Javascript
Vuex的各个模块封装的实现
2020/06/05 Javascript
Python下singleton模式的实现方法
2014/07/16 Python
Python3实现生成随机密码的方法
2014/08/23 Python
Python爬虫爬验证码实现功能详解
2016/04/14 Python
基于Python函数的作用域规则和闭包(详解)
2017/11/29 Python
python @property的用法及含义全面解析
2018/02/01 Python
python调用动态链接库的基本过程详解
2019/06/19 Python
python处理document文档保留原样式
2019/09/23 Python
Python3读写Excel文件(使用xlrd,xlsxwriter,openpyxl3种方式读写实例与优劣)
2020/02/13 Python
浅谈python的elementtree模块处理中文注意事项
2020/03/06 Python
Python退出时强制运行一段代码的实现方法
2020/04/29 Python
Python是怎样处理json模块的
2020/07/16 Python
Python使用lambda抛出异常实现方法解析
2020/08/20 Python
python实现KNN近邻算法
2020/12/30 Python
浅谈matplotlib默认字体设置探索
2021/02/03 Python
Pamela Love官网:纽约设计师Pamela Love的精美、时尚和穿孔珠宝
2020/10/19 全球购物
美国亚马逊旗下时尚女装网店:SHOPBOP(支持中文)
2020/10/17 全球购物
工程造价与管理专业应届生求职信
2013/11/23 职场文书
学校采购员岗位职责
2014/01/02 职场文书
端午节粽子促销活动方案
2014/02/02 职场文书
大三学生做职业规划:给未来找个方向
2014/02/24 职场文书
委托书范文
2014/04/02 职场文书
国旗下的演讲稿
2014/05/08 职场文书
运动会方队口号
2014/06/07 职场文书
违反交通安全法检讨书
2014/10/24 职场文书
旷课检讨书
2015/01/26 职场文书
小学中队长竞选稿
2015/11/20 职场文书
PyTorch中的torch.cat简单介绍
2022/03/17 Python