Python urllib.request对象案例解析


Posted in Python onMay 11, 2020

刚刚接触爬虫,基础的东西得时时回顾才行,这么全面的帖子无论如何也得厚着脸皮转过来啊!

什么是 Urllib 库?

urllib 库 是 Python 内置的 HTTP 请求库。urllib 模块提供的上层接口,使访问 www 和 ftp 上的数据就像访问本地文件一样。

有以下几种模块:

1.urllib.request 请求模块

2. urllib.error 异常处理模块

3. urllib.parse url 解析模块

4. urllib.robotparser robots.txt 解析模块

Urllib 库下的几种模块基本使用如下:

urllib.request

关于 urllib.request: urllib.request 模块提供了最基本的构造 HTTP (或其他协议如 FTP)请求的方法,利用它可以模拟浏览器的一个请求发起过程。利用不同的协议去获取 URL 信息。它的某些接口能够处理基础认证 ( Basic Authenticaton) 、redirections (HTTP 重定向)、 Cookies (浏览器 Cookies)等情况。而这些接口是由 handlers 和 openers 对象提供的。

1.常用的方法有

  • read()==读取文件内容

  • geturl()==获取请求url

  • getheaders()==获取http请求头信息

  • getcode()==获取状态码

  • readlines()==获取一行

2.案例

#coding=utf-8
#import urllib.request
#=========response方法使用
#read()==读取文件内容
#geturl()==获取请求url
#getheaders()==获取http请求头信息
#getcode()==获取状态码
#readlines()==获取一行
#url="http://www.baidu.com";
#response = urllib.request.urlopen(url);
#=====案例1
# str = response.read().decode();#这样通过decode转换为utf8
# with open("baidu.html","w",encoding="utf8") as fp:
#   fp.write(str);
#=====案例2通过字节流写=默认通过read读取的是字节流
# with open("bai.html","wb") as fp:
#   fp.write(response.read()); 
#==使用字节流读取存图片
# image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
# response = urllib.request.urlopen(image_url);
# with open("mv.jpg",'wb') as fp:
#   fp.write(response.read());
#案例3==使用内置函数读取图片
#image_url='https://ss3.bdstatic.com/70cFv8Sh_Q1YnxGkpoWK1HF6hhy/it/u=3772530225,1800402028&fm=26&gp=0.jpg';
#urllib.request.urlretrieve(image_url,"chun.jpg");

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中输出ASCII大文字、艺术字、字符字小技巧
Apr 28 Python
Python利用matplotlib生成图片背景及图例透明的效果
Apr 27 Python
Python编程求质数实例代码
Jan 31 Python
python实现linux下抓包并存库功能
Jul 18 Python
Random 在 Python 中的使用方法
Aug 09 Python
Python实现将Excel转换成xml的方法示例
Aug 25 Python
Python2和Python3.6环境解决共存问题
Nov 09 Python
Python3.7 新特性之dataclass装饰器
May 27 Python
PyQt5 加载图片和文本文件的实例
Jun 14 Python
利用pandas合并多个excel的方法示例
Oct 10 Python
Tensorflow--取tensorf指定列的操作方式
Jun 30 Python
利用scikitlearn画ROC曲线实例
Jul 02 Python
python将dict中的unicode打印成中文实例
May 11 #Python
ansible-playbook实现自动部署KVM及安装python3的详细教程
May 11 #Python
Python转换字典成为对象,可以用"."方式访问对象属性实例
May 11 #Python
Python3自定义json逐层解析器代码
May 11 #Python
Python3自定义http/https请求拦截mitmproxy脚本实例
May 11 #Python
Python 找出出现次数超过数组长度一半的元素实例
May 11 #Python
Pycharm如何导入python文件及解决报错问题
May 10 #Python
You might like
php提交表单时判断 if($_POST[submit])与 if(isset($_POST[submit])) 的区别
2011/02/08 PHP
PHP Streams(流)详细介绍及使用
2015/05/12 PHP
php封装的smartyBC类完整实例
2016/10/19 PHP
javascript第一课
2007/02/27 Javascript
JavaScript 异步调用框架 (Part 2 - 用例设计)
2009/08/03 Javascript
通过DOM脚本去设置样式信息
2010/09/19 Javascript
js隐式全局变量造成的bug示例代码
2014/04/22 Javascript
jQuery中使用each处理json数据
2015/04/23 Javascript
javascript设计简单的秒表计时器
2020/09/05 Javascript
通过设置CSS中的position属性来固定层的位置
2015/12/14 Javascript
JavaScript File API文件上传预览
2016/02/02 Javascript
JS公共小方法之判断对象是否为domElement的实例
2016/11/25 Javascript
微信小程序实现顶部普通选项卡效果(非swiper)
2020/06/19 Javascript
详解angularJS+Ionic移动端图片上传的解决办法
2017/09/13 Javascript
浅谈VUE单页应用首屏加载速度优化方案
2018/08/28 Javascript
微信小程序实现基于三元运算验证手机号/姓名功能示例
2019/01/19 Javascript
ES6知识点整理之Proxy的应用实例详解
2019/04/16 Javascript
python之import机制详解
2014/07/03 Python
Python中对象的引用与复制代码示例
2017/12/04 Python
python time.sleep()是睡眠线程还是进程
2019/07/09 Python
python requests证书问题解决
2019/09/05 Python
python使用 cx_Oracle 模块进行查询操作示例
2019/11/28 Python
pycharm如何实现跨目录调用文件
2020/02/28 Python
Python Sqlalchemy如何实现select for update
2020/10/12 Python
用HTML5制作烟火效果的教程
2015/05/12 HTML / CSS
介绍JAVA 中的Collection FrameWork(及如何写自己的数据结构)
2014/10/31 面试题
运动会开幕式邀请函
2014/01/22 职场文书
认识深刻的检讨书
2014/02/16 职场文书
文明礼仪伴我行演讲稿
2014/05/12 职场文书
好的旅游活动方案
2014/08/19 职场文书
教师节感恩老师演讲稿
2014/08/28 职场文书
爱心捐助活动总结
2015/05/09 职场文书
《抽屉原理》教学反思
2016/02/20 职场文书
先进个人事迹材料(2016推荐版)
2016/03/01 职场文书
python 模块重载的五种方法
2021/04/24 Python
基于Redis过期事件实现订单超时取消
2021/05/08 Redis