编程 Python

python爬虫多次请求超时的几种重试方法(6种)

Posted in Python onDecember 01, 2020

第一种方法

headers = Dict()
url = 'https://www.baidu.com'
try:
 proxies = None
 response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
except:
 # logdebug('requests failed one time')
 try:
  proxies = None
  response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
 except:
  # logdebug('requests failed two time')
  print('requests failed two time')

总结：代码比较冗余，重试try的次数越多，代码行数越多，但是打印日志比较方便

第二种方法

def requestDemo(url，):
 headers = Dict()
 trytimes = 3 # 重试的次数
 for i in range(trytimes):
 try:
  proxies = None
  response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
  # 注意此处也可能是302等状态码
  if response.status_code == 200:
  break
 except:
  # logdebug(f'requests failed {i}time')
   print(f'requests failed {i} time')

总结：遍历代码明显比第一个简化了很多，打印日志也方便

第三种方法

def requestDemo(url， times=1):
 headers = Dict()
 try:
  proxies = None
  response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
  html = response.text()
  # todo 此处处理代码正常逻辑
  pass
  return html
 except:
  # logdebug(f'requests failed {i}time')
  trytimes = 3 # 重试的次数
  if times < trytimes:
  times += 1
   return requestDemo(url， times)
  return 'out of maxtimes'

总结：迭代显得比较高大上，中间处理代码时有其它错误照样可以进行重试；缺点不太好理解，容易出错，另外try包含的内容过多时，对代码运行速度不利。

第四种方法

@retry(3) # 重试的次数 3
def requestDemo(url):
 headers = Dict()
 proxies = None
 response = requests.get(url, headers=headers, verify=False, proxies=None, timeout=3)
 html = response.text()
 # todo 此处处理代码正常逻辑
 pass
 return html
 
def retry(times):
 def wrapper(func):
  def inner_wrapper(*args, **kwargs):
   i = 0
   while i < times:
    try:
     print(i)
     return func(*args, **kwargs)
    except:
     # 此处打印日志 func.__name__ 为say函数
     print("logdebug: {}()".format(func.__name__))
     i += 1
  return inner_wrapper
 return wrapper

总结：装饰器优点多种函数复用，使用十分方便

第五种方法

#!/usr/bin/python
# -*-coding='utf-8' -*-
import requests
import time
import json
from lxml import etree
import warnings
warnings.filterwarnings("ignore")

def get_xiaomi():
 try:
  # for n in range(5): # 重试5次
  #  print("第"+str(n)+"次")
  for a in range(5): # 重试5次
   print(a)
   url = "https://www.mi.com/"
   headers = {
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3",
    "Accept-Encoding": "gzip, deflate, br",
    "Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
    "Connection": "keep-alive",
    # "Cookie": "xmuuid=XMGUEST-D80D9CE0-910B-11EA-8EE0-3131E8FF9940; Hm_lvt_c3e3e8b3ea48955284516b186acf0f4e=1588929065; XM_agreement=0; pageid=81190ccc4d52f577; lastsource=www.baidu.com; mstuid=1588929065187_5718; log_code=81190ccc4d52f577-e0f893c4337cbe4d|https%3A%2F%2Fwww.mi.com%2F; Hm_lpvt_c3e3e8b3ea48955284516b186acf0f4e=1588929099; mstz=||1156285732.7|||; xm_vistor=1588929065187_5718_1588929065187-1588929100964",
    "Host": "www.mi.com",
    "Upgrade-Insecure-Requests": "1",
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.90 Safari/537.36"
   }
   response = requests.get(url,headers=headers,timeout=10,verify=False)
   html = etree.HTML(response.text)
   # print(html)
   result = etree.tostring(html)
   # print(result)
   print(result.decode("utf-8"))
   title = html.xpath('//head/title/text()')[0]
   print("title==",title)
   if "左左" in title:
   # print(response.status_code)
   # if response.status_code ==200:
    break
  return title

 except:
  result = "异常"
  return result

if __name__ == '__main__':
 print(get_xiaomi())

第六种方法

Python重试模块retrying

# 设置最大重试次数
@retry(stop_max_attempt_number=5)
def get_proxies(self):
 r = requests.get('代理地址')
 print('正在获取')
 raise Exception("异常")
 print('获取到最新代理 = %s' % r.text)
 params = dict()
 if r and r.status_code == 200:
  proxy = str(r.content, encoding='utf-8')
  params['http'] = 'http://' + proxy
  params['https'] = 'https://' + proxy

# 设置方法的最大延迟时间，默认为100毫秒(是执行这个方法重试的总时间)
@retry(stop_max_attempt_number=5,stop_max_delay=50)
# 通过设置为50，我们会发现，任务并没有执行5次才结束！

# 添加每次方法执行之间的等待时间
@retry(stop_max_attempt_number=5,wait_fixed=2000)
# 随机的等待时间
@retry(stop_max_attempt_number=5,wait_random_min=100,wait_random_max=2000)
# 每调用一次增加固定时长
@retry(stop_max_attempt_number=5,wait_incrementing_increment=1000)

# 根据异常重试，先看个简单的例子
def retry_if_io_error(exception):
 return isinstance(exception, IOError)

@retry(retry_on_exception=retry_if_io_error)
def read_a_file():
 with open("file", "r") as f:
  return f.read()

read_a_file函数如果抛出了异常，会去retry_on_exception指向的函数去判断返回的是True还是False，如果是True则运行指定的重试次数后，抛出异常，False的话直接抛出异常。

当时自己测试的时候网上一大堆抄来抄去的，意思是retry_on_exception指定一个函数，函数返回指定异常，会重试，不是异常会退出。真坑人啊！

来看看获取代理的应用(仅仅是为了测试retrying模块)

到此这篇关于python爬虫多次请求超时的几种重试方法的文章就介绍到这了,更多相关python爬虫多次请求超时内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

python爬虫多次请求超时的几种重试方法(6种)

- Author -

莫贞俊晗

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python实现Windows上气泡提醒效果的方法

Jun 03 Python

python编程实现随机生成多个椭圆实例代码

Jan 03 Python

python实现百万答题自动百度搜索答案

Jan 16 Python

python模仿网页版微信发送消息功能

Feb 24 Python

Python 2/3下处理cjk编码的zip文件的方法

Apr 26 Python

python图像和办公文档处理总结

May 28 Python

python地震数据可视化详解

Jun 18 Python

解决tensorboard多个events文件显示紊乱的问题

Feb 15 Python

Django Session和Cookie分别实现记住用户登录状态操作

Jul 02 Python

OpenCV+Python3.5 简易手势识别的实现

Dec 21 Python

Python基础之tkinter图形化界面学习

Apr 29 Python

一行Python命令实现批量加水印

Apr 07 Python

python爬虫搭配起Bilibili唧唧的流程分析

Dec 01 #Python

python爬虫看看虎牙女主播中谁最“顶”步骤详解

Dec 01 #Python

详解Django自定义图片和文件上传路径(upload_to)的2种方式

Dec 01 #Python

使用python爬取抖音app视频的实例代码

Dec 01 #Python

基于Python实现粒子滤波效果

Dec 01 #Python

Django集成MongoDB实现过程解析

Dec 01 #Python

基于Django快速集成Echarts代码示例

Dec 01 #Python

You might like

实现分十页分向前十页向后十页的处理

2006/10/09 PHP

php学习之数组声明

2011/06/09 PHP

PHP英文字母大小写转换函数小结

2014/05/03 PHP

PHP中round()函数对浮点数进行四舍五入的方法

2014/11/19 PHP

Apache启动报错No space left on device: AH00023该怎么解决

2015/10/16 PHP

PHP框架实现WebSocket在线聊天通讯系统

2019/11/21 PHP

面向对象Javascript核心支持代码分享

2012/05/23 Javascript

简单谈谈jQuery(function(){})与(function(){})(jQuery)

2014/12/19 Javascript

JS实现霓虹灯文字效果的方法

2015/08/06 Javascript

jquery uploadify隐藏上传进度的实现方法

2017/02/06 Javascript

jQuery animate()实现背景色渐变效果的处理方法【使用jQuery.color.js插件】

2017/03/15 Javascript

微信公众号菜单配置微信小程序实例详解

2017/03/31 Javascript

详解vuejs之v-for列表渲染

2017/06/22 Javascript

详解VUE中v-bind的基本用法

2017/07/13 Javascript

vue实现2048小游戏功能思路详解

2018/05/09 Javascript

微信小程序select下拉框实现效果

2019/05/15 Javascript

vue项目中使用bpmn为节点添加颜色的方法

2020/04/30 Javascript

vue+element UI实现树形表格

2020/12/29 Vue.js

Python多线程实现同步的四种方式

2017/05/02 Python

python爬虫使用cookie登录详解

2017/12/27 Python

python3.6 实现AES加密的示例(pyCryptodome)

2018/01/10 Python

python使用装饰器作日志处理的方法

2019/07/11 Python

Python异常模块traceback用法实例分析

2019/10/22 Python

css3 flex布局 justify-content:space-between 最后一行左对齐

2020/01/02 HTML / CSS

实例讲解使用SVG制作loading加载动画的方法

2016/04/05 HTML / CSS

德国网上药房：Apotal

2017/04/04 全球购物

介绍一下gcc特性

2015/10/31 面试题

英语专业学生个人求职信

2014/01/28 职场文书

大学生暑期实践感言

2014/02/26 职场文书

演讲稿格式

2014/04/30 职场文书

幼儿园安全生产月活动总结

2014/07/05 职场文书

中职招生先进个人材料

2014/08/31 职场文书

幼儿园小班家长评语

2014/12/30 职场文书

同学聚会通知短信

2015/04/20 职场文书

《夜莺的歌声》教学反思

2016/02/22 职场文书

实习报告范文之电话客服岗位

2019/07/26 职场文书