Python urllib.request对象案例解析


Posted in Python onMay 11, 2020

刚刚接触爬虫,基础的东西得时时回顾才行,这么全面的帖子无论如何也得厚着脸皮转过来啊!

什么是 Urllib 库?

urllib 库 是 Python 内置的 HTTP 请求库。urllib 模块提供的上层接口,使访问 www 和 ftp 上的数据就像访问本地文件一样。

有以下几种模块:

1.urllib.request 请求模块

2. urllib.error 异常处理模块

3. urllib.parse url 解析模块

4. urllib.robotparser robots.txt 解析模块

Urllib 库下的几种模块基本使用如下:

urllib.request

关于 urllib.request: urllib.request 模块提供了最基本的构造 HTTP (或其他协议如 FTP)请求的方法,利用它可以模拟浏览器的一个请求发起过程。利用不同的协议去获取 URL 信息。它的某些接口能够处理基础认证 ( Basic Authenticaton) 、redirections (HTTP 重定向)、 Cookies (浏览器 Cookies)等情况。而这些接口是由 handlers 和 openers 对象提供的。

1.常用的方法有

  • read()==读取文件内容

  • geturl()==获取请求url

  • getheaders()==获取http请求头信息

  • getcode()==获取状态码

  • readlines()==获取一行

2.案例

#coding=utf-8
#import urllib.request
#=========response方法使用
#read()==读取文件内容
#geturl()==获取请求url
#getheaders()==获取http请求头信息
#getcode()==获取状态码
#readlines()==获取一行
#url="http://www.baidu.com";
#response = urllib.request.urlopen(url);
#=====案例1
# str = response.read().decode();#这样通过decode转换为utf8
# with open("baidu.html","w",encoding="utf8") as fp:
#   fp.write(str);
#=====案例2通过字节流写=默认通过read读取的是字节流
# with open("bai.html","wb") as fp:
#   fp.write(response.read()); 
#==使用字节流读取存图片
# image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
# response = urllib.request.urlopen(image_url);
# with open("mv.jpg",'wb') as fp:
#   fp.write(response.read());
#案例3==使用内置函数读取图片
#image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
#urllib.request.urlretrieve(image_url,"chun.jpg");

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用Python的线程来解决生产者消费问题的示例
Apr 02 Python
python通过索引遍历列表的方法
May 04 Python
Python将多个excel文件合并为一个文件
Jan 03 Python
python机器学习理论与实战(六)支持向量机
Jan 19 Python
Django中反向生成models.py的实例讲解
May 30 Python
Python从使用线程到使用async/await的深入讲解
Sep 16 Python
详解python爬虫系列之初识爬虫
Apr 06 Python
Python matplotlib画图与中文设置操作实例分析
Apr 23 Python
python3.7 利用函数os pandas利用excel对文件名进行归类
Sep 29 Python
Pytorch to(device)用法
Jan 08 Python
Django DRF路由与扩展功能的实现
Jun 03 Python
Python  word实现读取及导出代码解析
Jul 09 Python
python将dict中的unicode打印成中文实例
May 11 #Python
ansible-playbook实现自动部署KVM及安装python3的详细教程
May 11 #Python
Python转换字典成为对象,可以用"."方式访问对象属性实例
May 11 #Python
Python3自定义json逐层解析器代码
May 11 #Python
Python3自定义http/https请求拦截mitmproxy脚本实例
May 11 #Python
Python 找出出现次数超过数组长度一半的元素实例
May 11 #Python
Pycharm如何导入python文件及解决报错问题
May 10 #Python
You might like
IIS下配置Php+Mysql+zend的图文教程
2006/12/08 PHP
php模拟post行为代码总结(POST方式不是绝对安全)
2012/02/22 PHP
将二维数组转为一维数组的2种方法
2014/05/26 PHP
yii2.0实现验证用户名与邮箱功能
2015/12/22 PHP
我整理的PHP 7.0主要新特性
2016/01/07 PHP
php微信公众号开发之秒杀
2018/10/20 PHP
对laravel的csrf 防御机制详解,及form中csrf_token()的存在介绍
2019/10/24 PHP
fireworks菜单生成器mm_menu.js在 IE 7.0 显示问题的解决方法
2009/10/20 Javascript
yepnope.js 异步加载资源文件
2011/09/08 Javascript
javascript 进阶篇2 CSS XML学习
2012/03/14 Javascript
父元素与子iframe相互获取变量和元素对象的具体实现
2013/10/15 Javascript
jquery ajax对特殊字符进行转义防止js注入使用示例
2013/11/21 Javascript
一波JavaScript日期判断脚本分享
2016/03/06 Javascript
js 判断附件后缀的简单实现方法
2016/10/11 Javascript
nodejs连接mysql数据库简单封装示例-mysql模块
2017/04/10 NodeJs
Python 文件操作技巧(File operation) 实例代码分析
2008/08/11 Python
对numpy中数组元素的统一赋值实例
2018/04/04 Python
使用python对文件中的单词进行提取的方法示例
2018/12/21 Python
Python批量生成特定尺寸图片及图画任意文字的实例
2019/01/30 Python
Python实现个人微信号自动监控告警的示例
2019/07/03 Python
浅谈Python小波分析库Pywavelets的一点使用心得
2019/07/09 Python
Python人工智能之路 jieba gensim 最好别分家之最简单的相似度实现
2019/08/13 Python
Python使用指定字符长度切分数据示例
2019/12/05 Python
Python 合并拼接字符串的方法
2020/07/28 Python
CSS3中各种颜色属性的使用教程
2016/05/17 HTML / CSS
顶丰TOPPIK台湾官网:增发纤维假发,告别秃发困扰
2018/06/13 全球购物
美国网上书店:Barnes & Noble
2018/08/15 全球购物
C语言面试题
2015/10/30 面试题
作文批改评语大全
2014/04/23 职场文书
学习雷锋精神演讲稿
2014/05/10 职场文书
财务管理专业自荐书
2014/09/02 职场文书
2014年招商工作总结
2014/11/22 职场文书
员工家属慰问信
2015/03/24 职场文书
杨善洲观后感
2015/06/04 职场文书
java高级用法JNA强大的Memory和Pointer
2022/04/19 Java/Android
Tomcat安装使用及部署Web项目的3种方法汇总
2022/08/14 Servers