编程 Python

python中urllib.request和requests的使用及区别详解

Posted in Python onMay 05, 2020

urllib.request

我们都知道，urlopen()方法能发起最基本对的请求发起，但仅仅这些在我们的实际应用中一般都是不够的，可能我们需要加入headers之类的参数,那需要用功能更为强大的Request类来构建了

在不需要任何其他参数配置的时候，可直接通过urlopen()方法来发起一个简单的web请求

发起一个简单的请求

import urllib.request
url='https://www.douban.com'
webPage=urllib.request.urlopen(url)
print(webPage)
data=webPage.read()
print(data)
print(data.decode('utf-8'))

urlopen()方法返回的是一个http.client.HTTPResponse对象，需要通过read（）方法做进一步的处理。一般使用read（）后，我们需要用decode（）进行解码，通常为utf-8，经过这些步骤后，最终才获取到我们想要的网页。

添加Headers信息

import urllib.request
url='https://www.douban.com'
headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36',
 }
response=urllib.request.Request(url=url,headers=headers)
webPage=urllib.request.urlopen(response)
print(webPage.read().decode('utf-8'))

使用Request类返回的又是一个urllib.request.Request对象了。

通常我们爬取网页，在构造http请求的时候，都需要加上一些额外信息，什么Useragent，cookie等之类的信息，或者添加代理服务器。往往这些都是一些必要的反爬机制

requests

通常而言，在我们使用python爬虫时，更建议用requests库，因为requests比urllib更为便捷，requests可以直接构造get,post请求并发起，而urllib.request只能先构造get，post请求，再发起。

import requests
url='https://www.douban.com'
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.186 Safari/537.36',
}
get_response = requests.get(url,headers=headers,params=None)
post_response=requests.post(url,headers=headers,data=None,json=None)
print(post_response)
print(get_response.text)
print(get_response.content)
print(get_response.json)

get_response.text得到的是str数据类型。

get_response.content得到的是Bytes类型,需要进行解码。作用和get_response.text类似。

get_response.json得到的是json数据。

总而言之，requests是对urllib的进一步封装，因此在使用上显得更加的便捷，建议小伙伴们在实际应用当中尽量使用requests。

补充知识：python中urllib.request.Request()与urllib.request.urlopen()区别

蟒蛇中urllib.request.Request（）与urllib.request.urlopen（）的区别：

相对于urllib.request.urlopen（）来说urllib.request.Request是进一步的包装请求，下面是请求类的源码示例：

class Request:
  
  # 主要看这块，构造函数中指明了Request进一步包装请求中可以传递的参数有（url，data，headers，            
  # origin_req_host，unverifiable，method）
 
  def __init__(self, url, data=None, headers={},
         origin_req_host=None, unverifiable=False,
         method=None):
    self.full_url = url
    self.headers = {}
    self.unredirected_hdrs = {}
    self._data = None
    self.data = data
    self._tunnel_host = None
    for key, value in headers.items():
      self.add_header(key, value)
    if origin_req_host is None:
      origin_req_host = request_host(self)
    self.origin_req_host = origin_req_host
    self.unverifiable = unverifiable
    if method:
      self.method = method
  pass

我们可以这样使用（以下是模拟有道字典翻译发送的请求）：

# 请求地址url
url = "http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule"
 
# 请求头
request_headers = {
  'Host':'fanyi.youdao.com',
  "User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36",
}
 
# 发送给服务器的表单
form_data = {
  "i": word,
  "from": "AUTO",
  "to": "AUTO",
  "smartresult": "dict",
  "doctype": "json",
  "version": "2.1",
  "keyfrom": "fanyi.web",
  "action": "FY_BY_REALTIME",
  "typoResult": "false"
}
 
# POST发送的data必须为bytes或bytes类型的可迭代对象，不能是字符串
form_data = urllib.parse.urlencode(form_data).encode()
 
# 构造请求对象Request
req = urllib.request.Request(url, data=form_data, headers=request_headers)
 
# 发起请求
response = urllib.request.urlopen(req)
data = response.read().decode()
print(data)

所以，总的来说，如果我们在获取请求对象时，不需要过多的参数传递，我么可以直接选择urllib.request.urlopen（）;如果需要进一步的包装请求，则需要用urllib.request里。的urlopen（）进行包装处理。

以上这篇python中urllib.request和requests的使用及区别详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

python中urllib.request和requests的使用及区别详解

- Author -

野‘’狼

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python计算程序开始到程序结束的运行时间和程序运行的CPU时间

Nov 28 Python

用Python编程实现语音控制电脑

Apr 01 Python

用Python登录Gmail并发送Gmail邮件的教程

Apr 17 Python

深入解析Python中的list列表及其切片和迭代操作

Mar 13 Python

Python实现二叉树结构与进行二叉树遍历的方法详解

May 24 Python

python爬虫爬取某站上海租房图片

Feb 04 Python

python3+requests接口自动化session操作方法

Oct 13 Python

Python OpenCV之图片缩放的实现（cv2.resize）

Jun 28 Python

python手写均值滤波

Feb 19 Python

使用Django清空数据库并重新生成

Apr 03 Python

在django中form的label和verbose name的区别说明

May 20 Python

python实现的web监控系统

Apr 27 Python

python requests包的request()函数中的参数-params和data的区别介绍

May 05 #Python

关于Python解包知识点总结

May 05 #Python

python 使用事件对象asyncio.Event来同步协程的操作

May 04 #Python

在python里使用await关键字来等另外一个协程的实例

May 04 #Python

python 异步async库的使用说明

May 04 #Python

Python插件机制实现详解

May 04 #Python

python3+selenium获取页面加载的所有静态资源文件链接操作

May 04 #Python

You might like

substr()函数中文版

2006/10/09 PHP

php生成EXCEL的东东

2006/10/09 PHP

PHP XML数据解析代码

2010/05/26 PHP

php dirname(__FILE__) 获取当前文件的绝对路径

2011/06/28 PHP

php使用curl抓取qq空间的访客信息示例

2014/02/28 PHP

php广告加载类用法实例

2014/09/23 PHP

PHP的命令行命令使用指南

2015/08/18 PHP

php微信公众号开发之秒杀

2018/10/20 PHP

Mootools 1.2教程排序类和方法简介

2009/09/15 Javascript

JSON 编辑器实现代码

2009/12/06 Javascript

json的前台操作和后台操作实现代码

2012/01/20 Javascript

优化Jquery,提升网页加载速度

2013/11/14 Javascript

js中的for如何实现foreach中的遍历

2014/05/31 Javascript

node.js中的url.parse方法使用说明

2014/12/10 Javascript

jQuery实现手机号码输入提示功能实例

2015/04/30 Javascript

BootStrap 附加导航组件

2016/07/22 Javascript

使用Promise链式调用解决多个异步回调的问题

2017/01/15 Javascript

使用jquery datatable和bootsrap创建表格实例代码

2017/03/17 Javascript

解决Vue 通过下表修改数组,页面不渲染的问题

2018/03/08 Javascript

JS实现点击按钮可实现编辑功能

2018/07/03 Javascript

JS实现简单的星期格式转换功能示例

2018/07/23 Javascript

在vue中使用SockJS实现webSocket通信的过程

2018/08/29 Javascript

JS 数组随机洗牌的实例代码

2018/09/12 Javascript

vue-cli3环境变量与分环境打包的方法示例

2019/02/18 Javascript

Javascript模块化机制实现原理详解

2020/04/02 Javascript

vue+elementUI 实现内容区域高度自适应的示例

2020/09/26 Javascript

[01:37]PWL S2开团时刻DAY1&2——这符有毒

2020/11/20 DOTA

python timestamp和datetime之间转换详解

2017/12/11 Python

Python实现识别手写数字简易图片存储管理系统

2018/01/29 Python

python学习开发mock接口

2019/04/28 Python

python字符串替换第一个字符串的方法

2019/06/26 Python

已安装tensorflow-gpu,但keras无法使用GPU加速的解决

2020/02/07 Python

Html5 webRTC简单实现视频调用的示例代码

2020/09/23 HTML / CSS

预订全球最佳旅行体验：Viator

2018/03/30 全球购物

2014年世界艾滋病日演讲稿

2014/11/28 职场文书

pandas中DataFrame检测重复值的实现

2021/05/26 Python