python爬虫快速响应服务器的做法


Posted in Python onNovember 24, 2020

不论是打开网页或者爬取一些资料的时候,我们想要的是计算机能在最短的时间内运行出结果,不然等待的时间过长会影响下一步工作的计划。这时候我们可以给计算机一个指令,限制最久能等待的时间,在我们能接受的时间内运行出结果。那么这个指令方法是什么呢?接下来我们一起看看吧。

requests之所以称为“HTTP for human”,因为其封装层次很高,其中一处体现就在:requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候,搜狗搜索列表页面的公众号文章地址,其实不是微信的地址而需要请求到搜狗到服务器做重定向,而requests的默认处理则是将整个过程全部搞定,对此可以这样:

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外,有时候对方网站的响应时间太长了,我们希望在指定时间内完事,或者直接停止这个请求,这时候的做法是:

In [1]: r = requests.get('http://xlzd.me', timeout=3)

timeout表示这次请求最长我最长只等待多少秒

拓展:

为requests套上一层代理的做法也非常简单:

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

到此这篇关于python爬虫快速响应服务器的做法的文章就介绍到这了,更多相关python爬虫中如何快速响应服务器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
跟老齐学Python之关于循环的小伎俩
Oct 02 Python
Python lambda和Python def区别分析
Nov 30 Python
在Mac OS上搭建Python的开发环境
Dec 24 Python
Python验证码识别处理实例
Dec 28 Python
python将unicode转为str的方法
Jun 21 Python
python读取与写入csv格式文件的示例代码
Dec 16 Python
python获取磁盘号下盘符步骤详解
Jun 19 Python
pytorch实现建立自己的数据集(以mnist为例)
Jan 18 Python
Python实现新型冠状病毒传播模型及预测代码实例
Feb 05 Python
python误差棒图errorbar()函数实例解析
Feb 11 Python
Python 为什么推荐蛇形命名法原因浅析
Jun 18 Python
Python类成员继承重写的实现
Sep 16 Python
PyCharm Community安装与配置的详细教程
Nov 24 #Python
python3爬虫GIL修改多线程实例讲解
Nov 24 #Python
Django URL参数Template反向解析
Nov 24 #Python
python3爬虫中引用Queue的实例讲解
Nov 24 #Python
python3爬虫中多线程的优势总结
Nov 24 #Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 #Python
python 如何停止一个死循环的线程
Nov 24 #Python
You might like
PHP计划任务、定时执行任务的实现代码
2011/04/23 PHP
PHP中的多行字符串传递给JavaScript的两种方法
2014/06/19 PHP
ThinkPHP实现递归无级分类――代码少
2015/07/29 PHP
Laravel服务容器绑定的几种方法总结
2020/06/14 PHP
封装好的省市地区联动控件附下载
2007/08/13 Javascript
jquery实现漂亮的二级下拉菜单代码
2015/08/26 Javascript
jQuery toggle 代替方法
2016/03/22 Javascript
使用Javascript监控前端相关数据的代码
2016/10/27 Javascript
jQuery时间日期三级联动(推荐)
2016/11/27 Javascript
基于jQuery插件jqzoom实现的图片放大镜效果示例
2017/01/23 Javascript
JS实现直接运行html代码的方法
2017/03/13 Javascript
JS传参及动态修改页面布局
2017/04/13 Javascript
jquery+css实现简单的图片轮播效果
2017/08/07 jQuery
Angularjs 1.3 中的$parse实例代码
2017/09/14 Javascript
详解vue mint-ui源码解析之loadmore组件
2017/10/11 Javascript
详解在vue-cli中引用jQuery、bootstrap以及使用sass、less编写css
2017/11/08 jQuery
JS实现的3des+base64加密解密算法完整示例
2018/05/18 Javascript
JavaScript如何处理移动端拍摄图片旋转问题
2019/11/16 Javascript
[01:07:46]完美世界DOTA2联赛循环赛 Magma vs IO BO2第二场 11.01
2020/11/02 DOTA
Python 探针的实现原理
2016/04/23 Python
Python中flatten( )函数及函数用法详解
2018/11/02 Python
Python 按字典dict的键排序,并取出相应的键值放于list中的实例
2019/02/12 Python
Python字符串逆序的实现方法【一题多解】
2019/02/18 Python
Python自动生成代码 使用tkinter图形化操作并生成代码框架
2019/09/18 Python
Python 3 使用Pillow生成漂亮的分形树图片
2019/12/24 Python
通过代码实例了解Python3编程技巧
2020/10/13 Python
使用CSS3的ruby-position固定注音位置的用法示例
2016/07/05 HTML / CSS
HealthElement海外旗舰店:新西兰大卖场
2018/02/23 全球购物
极度干燥澳大利亚官方网站:Superdry澳大利亚
2019/03/28 全球购物
Bonami斯洛伐克:购买家具和家居饰品
2019/07/02 全球购物
应用电子专业学生的自我评价
2013/10/16 职场文书
会计学自荐信
2014/06/03 职场文书
安全检查汇报材料
2014/12/26 职场文书
学习计划是什么
2019/04/30 职场文书
python 模块重载的五种方法
2021/04/24 Python
MySQL运行报错:“Expression #1 of SELECT list is not in GROUP BY clause and contains nonaggre”解决方法
2022/06/14 MySQL