编程 Python

对python3 urllib包与http包的使用详解

Posted in Python onMay 10, 2018

urllib包和http包都是面向HTTP协议的。其中urllib主要用于处理 URL，使用urllib操作URL可以像使用和打开本地文件一样地操作。而 http包则实现了对 HTTP协议的封装，是urllib.request模块的底层。

1.urllib包简介

2. http 包简介

1.urllib包简介

urllib包主要模块有：

1.urllib.request -----用于打开 URL网址；

2.urllib.error ---------定义了常见的urllib.request会引发的异常；

3.urllib.parse---------用于解析 URL；

具体方法：

urllib.request.urlopen( url，data，proxies ) ：用于打开 url

参数如下：

url：要进行操作的 URL地址

data：可选项。向URL 传递的数据。

proxies：可选项。使用的代理地址

import urllib.request
url = 'http://www.baidu.com'   #网页为百度首页
respone = urllib.request.urlopen(url) #打开url地址,并返回一个 HTTPRespone实例
html = respone.read().decode('utf-8') #调用实例的 read()方法，并用 utf-8进行解码处理。就得出完整的百度的HTML文件
print(html)

部分打印结果：

<html>
<head>
 
 <meta http-equiv="content-type" content="text/html;charset=utf-8">
 <meta http-equiv="X-UA-Compatible" content="IE=Edge">
	<meta content="always" name="referrer">
 <meta name="theme-color" content="#2932e1">
 <link rel="shortcut icon" href="/favicon.ico" rel="external nofollow" type="image/x-icon" />
 <link rel="search" type="application/opensearchdescription+xml" href="/content-search.xml" rel="external nofollow" title="百度搜索" /> 
 <link rel="icon" sizes="any" mask href="//www.baidu.com/img/baidu.svg" rel="external nofollow" >

urllib.request.urlretrieve(url，filename，reporthook，data) ：用于将 URL的HTML文件下载并保存为本地文件

参数如下：

url：要下载的网页

filename：保存在主机的路径，可选项。

reporthook：一个回调函数，可选项。

data：发送的数据，一般用于 post，可选项。

特别：关于urlretrieve()的回调函数reporthook：可以用来显示下载的进度，几乎已经封装好

import urllib.request
def callbackfunc(blocknum, blocksize, totalsize): #这三个参数是由 urlretrieve自动赋值的
 '''回调函数
 @blocknum: 已经下载的数据块
 @blocksize: 数据块的大小
 @totalsize: 远程文件的大小
 '''
 percent = 100.0 * blocknum * blocksize / totalsize
 if percent > 100:
  percent = 100
 print( "%.2f%%"% percent) #保留两位小数
url = 'http://www.sina.com'
local = 'd:\\sina.html'        #下载的html文件保存在 d盘的sina.html里
urllib.request.urlretrieve(url,local,callbackfunc) #没下载完一个数据块，就会执行回调函数一次

执行结果：

//只显示局部 
0.00% 
1.38% 
2.76% 
4.13% 
5.51% 
6.89%

2. http包简介

http包提供了 HTTP协议的一些功能，主要模块有：

http.client --- 底层的 HTTP 协议的一些功能，可以为 urllib.request 模块所用

http.server --- 提供了基于 socketserver模块的基本 HTTP服务器类

http.cookies --- cookies 的管理工具

http.client ：

HttpClient不是一个浏览器。它是一个客户端的HTTP通信实现库。HttpClient的目标是发送和接收HTTP报文。

两个主要类(用于客户端)：

HTTPConnection ：基于HTTP协议的客户端，指定 URL(网址) 后，可以发送请求报文和接收响应报文

HTTPRespone ：基于 HTTP 协议的服务端回应。一旦用 HTTPConnection 成功连接，可以调用相关方法返回该实例(HTTPRequest实例)。

（1）HTTPConnection 的方法：

构造方法： HTTPConnection( host，port，[timeout] ) 返回一个HTTPConnection 实例

host：表示主机域名或 ip 地址

port：表示端口

timeout：阻塞操作将会在给定时间后超时。可选项

发送请求报文方法：HTTPConnection.request( method，url，body =None，headers = {} )

method：发送的操作，一般为 GET 或者 POST

url ：进行操作的 url

body ：所发送的数据

headers：发送的 HTTP头部，是一个字典类型

获取响应报文方法：HTTPConnection.getrespone( )

关闭与服务器的连接： HTTPConne.close()

发送一个头部：HTTPConnection.putheader( header，args[ ] ) #头部以一个字典方式发送

发送一个空白行到服务器，标志头部Header的结束：HTTPConnection.endheaders( )

发送数据到服务器：HTTPConnection.send( data ) ，应该在endheaders()之后和 getrespone()之前调用。

（2）HTTPRespone：

HTTPRespone对象：一旦用 HTTPConnection 成功连接，可以调用HTTPConnection.getrespone()返回该实例(HTTPRequest实例)。

HTTPRespone.getheader(name) ：返回头部中的 name 字段对应的值

HTTPRespone.getheaders( ) ：以元组的方式返回整个头部的信息

HTTPRespone.read() ：返回响应报文中的body部分，也即正文部分

HTTPRespone.status #返回状态码

HTTPRespone.version #返回 HTTP协议版本

http 包应用实例。

from http.client import HTTPConnection

con = HTTPConnection('www.baidu.com',80)
con.request('GET','/')   #发送请求报文
res = con.getresponse()   #获取响应报文对象
print(res.status) #200 (表示状态码)
print(res.reason) #OK	 （表示状态码对应的意义）
print(res.read().decode('utf-8')) #打印www.baidu.com的html

以上这篇对python3 urllib包与http包的使用详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

对python3 urllib包与http包的使用详解

- Author -

ZJE_ANDY

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python单例模式实例分析

Apr 08 Python

Python3多线程爬虫实例讲解代码

Jan 05 Python

Python实现的简单排列组合算法示例

Jul 04 Python

pandas去重复行并分类汇总的实现方法

Jan 29 Python

Django 数据库同步操作技巧详解

Jul 19 Python

利用 Flask 动态展示 Pyecharts 图表数据方法小结

Sep 04 Python

python 字符串常用函数详解

Sep 11 Python

Python3读写Excel文件(使用xlrd,xlsxwriter,openpyxl3种方式读写实例与优劣)

Feb 13 Python

python+selenium+Chrome options参数的使用

Mar 18 Python

解决Opencv+Python cv2.imshow闪退问题

Apr 24 Python

将pycharm配置为matlab或者spyder的用法说明

Jun 08 Python

解决pip install psycopg2出错问题

Jul 09 Python

Python3处理HTTP请求的实例

May 10 #Python

python字符串与url编码的转换实例

May 10 #Python

Python中的单继承与多继承实例分析

May 10 #Python

python3处理含有中文的url方法

May 10 #Python

Python异常处理操作实例详解

May 10 #Python

解决python3 网络请求路径包含中文的问题

May 10 #Python

Python之文字转图片方法

May 10 #Python

You might like

这东西价格，可以买几台TECSUN S-2000

2021/03/02 无线电

php 分页函数multi() discuz

2009/06/21 PHP

PHP网页游戏学习之Xnova(ogame)源码解读（一）

2014/06/23 PHP

PHP+MySQL实现输入页码跳转到指定页面功能示例

2018/06/01 PHP

用js实现计算代码行数的简单方法附代码

2007/08/13 Javascript

使用JQuery和s3captche实现一个水果名字的验证

2009/08/14 Javascript

jQuery 过滤not()与filter()实例代码

2012/05/10 Javascript

JavaScript的jQuery库中function的存在和参数问题

2015/08/13 Javascript

jQuery简单倒计时效果完整示例

2016/09/20 Javascript

微信小程序商城开发（ecshop ）简单实例

2017/04/07 Javascript

vue 使用ref 让父组件调用子组件的方法

2018/02/08 Javascript

JavaScript类的继承操作实例总结

2018/12/20 Javascript

对layui初始化列表的CheckBox属性详解

2019/09/13 Javascript

新手入门js闭包学习过程解析

2019/10/08 Javascript

vue 中的 render 函数作用详解

2020/02/28 Javascript

[02:35]DOTA2英雄基础教程狙击手

2014/01/14 DOTA

[01:32:10]NAVI vs VG Supermajor 败者组 BO3 第一场 6.5

2018/06/06 DOTA

[58:46]OG vs NAVI 2019国际邀请赛小组赛 BO2 第二场 8.15

2019/08/17 DOTA

python中字符串前面加r的作用

2015/06/04 Python

pygame实现弹力球及其变速效果

2017/07/03 Python

python机器学习理论与实战（二）决策树

2018/01/19 Python

tensorflow获取变量维度信息

2018/03/10 Python

利用Python如何制作好玩的GIF动图详解

2018/07/11 Python

Python 装饰器@，对函数进行功能扩展操作示例【开闭原则】

2019/10/17 Python

python golang中grpc 使用示例代码详解

2020/06/03 Python

python等待10秒执行下一命令的方法

2020/07/19 Python

jupyter notebook 写代码自动补全的实现

2020/11/02 Python

python基于openpyxl生成excel文件

2020/12/23 Python

CSS伪类与CSS伪元素的区别及由来具体说明

2012/12/07 HTML / CSS

瑞士网球商店：Tennis-Point

2020/03/12 全球购物

施工单位安全责任书

2014/07/24 职场文书

2014年转正工作总结

2014/11/08 职场文书

2014年销售助理工作总结

2014/12/01 职场文书

后勤个人工作总结

2015/02/28 职场文书

微软Win11有哪些隐藏功能? windows11多个功能汇总

2021/11/21 数码科技

mysql分组后合并显示一个字段的多条数据方式

2022/01/22 MySQL