python 获取网页编码方式实现代码


Posted in Python onMarch 11, 2017

python 获取网页编码方式实现代码

<span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
  </span><span style="font-family: Arial, Helvetica, sans-serif; background-color: rgb(255, 255, 255);">
python开发,自动化获取网页编码方式用到了chardet库,字符集检测,这个类在python2.7中没有,需要在官网上下载。
这里我下载好了chardet-2.3.0.tar.gz压缩包文件,只需要将压缩包文件解压后的chardet文件放到python安装包下的
python27/lib/site-packages/下,就可以了。</span>

 然后import chardet

下面写了一个自动化检测的函数供检测Url连接,然后返回网页url的编码方式。

import chardet #字符集检测 
import urllib 
 
url="http://www.jd.com" 
 
 
def automatic_detect(url): 
  content=urllib.urlopen(url).read() 
  result=chardet.detect(content) 
 
  encoding=result['encoding'] 
 
  return encoding 
 
urls=['http://www.baidu.com','http://www.163.com','http://dangdang.com'] 
for url in urls: 
  print url,automatic_detect(url)

上面用到了chardet类的detect方法,返回字典,然后取出编码方式encoding

感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!

Python 相关文章推荐
python高手之路python处理excel文件(方法汇总)
Jan 07 Python
Python中的左斜杠、右斜杠(正斜杠和反斜杠)
Aug 30 Python
python中Switch/Case实现的示例代码
Nov 09 Python
Pandas 数据框增、删、改、查、去重、抽样基本操作方法
Apr 12 Python
Python 统计字数的思路详解
May 08 Python
python实现顺时针打印矩阵
Mar 02 Python
python mac下安装虚拟环境的图文教程
Apr 12 Python
Python数据类型之Number数字操作实例详解
May 08 Python
解决Tensorflow占用GPU显存问题
Feb 03 Python
python实现随机加减法生成器
Feb 24 Python
pymysql 插入数据 转义处理方式
Mar 02 Python
python3通过qq邮箱发送邮件以及附件
May 20 Python
python 爬虫出现403禁止访问错误详解
Mar 11 #Python
Python如何读取MySQL数据库表数据
Mar 11 #Python
python3.5 + PyQt5 +Eric6 实现的一个计算器代码
Mar 11 #Python
Python搭建HTTP服务器和FTP服务器
Mar 09 #Python
开源Web应用框架Django图文教程
Mar 09 #Python
Python运算符重载详解及实例代码
Mar 07 #Python
利用Python中的pandas库对cdn日志进行分析详解
Mar 07 #Python
You might like
如何对PHP程序中的常见漏洞进行攻击(下)
2006/10/09 PHP
发布一个迷你php+AJAX聊天程序[聊天室]提供下载
2007/07/21 PHP
在普通HTTP上安全地传输密码
2007/07/21 PHP
PHP中CURL的CURLOPT_POSTFIELDS参数使用细节
2014/03/17 PHP
Thinkphp5 自定义上传文件名的实现方法
2019/07/23 PHP
JavaScript入门教程(2) JS基础知识
2009/01/31 Javascript
JavaScript 判断浏览器类型及版本
2009/02/21 Javascript
javascript的原生方法获取数组中的最大(最小)值
2012/12/19 Javascript
JavaScript 学习笔记之操作符(续)
2015/01/14 Javascript
TinyMCE汉化及本地上传图片功能实例详解
2016/05/31 Javascript
vue实现简单实时汇率计算功能
2017/01/15 Javascript
基于VUE选择上传图片并页面显示(图片可删除)
2017/05/25 Javascript
详解JS转换数值函数Number()、parseInt()、parseFloat()
2018/08/24 Javascript
vue点击input弹出带搜索键盘并监听该元素的方法
2018/08/25 Javascript
Python中__call__用法实例
2014/08/29 Python
浅谈python中set使用
2016/06/30 Python
Python入门_条件控制(详解)
2017/05/16 Python
Python绘制七段数码管实例代码
2017/12/20 Python
selenium+python自动化测试之环境搭建
2019/01/23 Python
Django项目创建到启动详解(最全最详细)
2019/09/07 Python
python正则表达式匹配IP代码实例
2019/12/28 Python
Django ORM判断查询结果是否为空,判断django中的orm为空实例
2020/07/09 Python
python Matplotlib模块的使用
2020/09/16 Python
matplotlib bar()实现多组数据并列柱状图通用简便创建方法
2021/02/24 Python
Penhaligon’s英国官网:成立于1870年的英国香水制造商
2021/02/18 全球购物
什么时候需要进行强制类型转换
2016/09/03 面试题
高中生家长寄语大全
2014/04/03 职场文书
工作保证书范文
2014/04/29 职场文书
英语系本科生求职信
2014/07/15 职场文书
心得体会的写法
2014/09/05 职场文书
党支部2014年度工作总结
2014/12/04 职场文书
2015年护士节活动策划方案
2015/05/04 职场文书
爱鸟护鸟的宣传语
2015/07/13 职场文书
2015上半年个人工作总结
2015/07/27 职场文书
用PYTHON去计算88键钢琴的琴键频率和音高
2022/04/10 Python
TS 类型收窄教程示例详解
2022/09/23 Javascript