python爬虫快速响应服务器的做法


Posted in Python onNovember 24, 2020

不论是打开网页或者爬取一些资料的时候,我们想要的是计算机能在最短的时间内运行出结果,不然等待的时间过长会影响下一步工作的计划。这时候我们可以给计算机一个指令,限制最久能等待的时间,在我们能接受的时间内运行出结果。那么这个指令方法是什么呢?接下来我们一起看看吧。

requests之所以称为“HTTP for human”,因为其封装层次很高,其中一处体现就在:requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候,搜狗搜索列表页面的公众号文章地址,其实不是微信的地址而需要请求到搜狗到服务器做重定向,而requests的默认处理则是将整个过程全部搞定,对此可以这样:

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外,有时候对方网站的响应时间太长了,我们希望在指定时间内完事,或者直接停止这个请求,这时候的做法是:

In [1]: r = requests.get('http://xlzd.me', timeout=3)

timeout表示这次请求最长我最长只等待多少秒

拓展:

为requests套上一层代理的做法也非常简单:

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

到此这篇关于python爬虫快速响应服务器的做法的文章就介绍到这了,更多相关python爬虫中如何快速响应服务器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中使用PyHook监听鼠标和键盘事件实例
Jul 18 Python
浅析Python多线程下的变量问题
Apr 28 Python
Python列表list内建函数用法实例分析【insert、remove、index、pop等】
Jul 24 Python
Python中 传递值 和 传递引用 的区别解析
Feb 22 Python
对python使用http、https代理的实例讲解
May 07 Python
pandas删除指定行详解
Apr 04 Python
利用python Selenium实现自动登陆京东签到领金币功能
Oct 31 Python
python的launcher用法知识点总结
Aug 07 Python
Python unittest如何生成HTMLTestRunner模块
Sep 08 Python
python安装sklearn模块的方法详解
Nov 28 Python
利用Python多线程实现图片下载器
Mar 25 Python
Python使用pandas导入xlsx格式的excel文件内容操作代码
Dec 24 Python
PyCharm Community安装与配置的详细教程
Nov 24 #Python
python3爬虫GIL修改多线程实例讲解
Nov 24 #Python
Django URL参数Template反向解析
Nov 24 #Python
python3爬虫中引用Queue的实例讲解
Nov 24 #Python
python3爬虫中多线程的优势总结
Nov 24 #Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 #Python
python 如何停止一个死循环的线程
Nov 24 #Python
You might like
PHP利用str_replace防注入的方法
2013/11/10 PHP
php中Ctype函数用法详解
2014/12/09 PHP
PHP+redis实现的购物车单例类示例
2019/02/02 PHP
Yii2框架中一些折磨人的坑
2019/12/15 PHP
关于Aptana Studio生成自动备份文件的解决办法
2009/12/23 Javascript
jquery在Chrome下获取图片的长宽问题解决
2013/03/20 Javascript
使用js操作css实现js改变背景图片示例
2014/03/10 Javascript
JavaScript通过this变量快速找出用户选中radio按钮的方法
2015/03/23 Javascript
JS和jQuery使用submit方法无法提交表单的原因分析及解决办法
2016/05/17 Javascript
客户端验证用户名和密码的方法详解
2016/06/16 Javascript
AngularJS+bootstrap实现动态选择商品功能示例
2017/05/17 Javascript
vue.js实现数据动态响应 Vue.set的简单应用
2017/06/15 Javascript
js+html5实现复制文字按钮
2017/07/15 Javascript
angular json对象push到数组中的方法
2018/02/27 Javascript
JavaScript实现旋转木马轮播图
2020/03/16 Javascript
[00:43]TI7不朽珍藏III——幽鬼不朽展示
2017/07/15 DOTA
利用Python中的输入和输出功能进行读取和写入的教程
2015/04/14 Python
python从sqlite读取并显示数据的方法
2015/05/08 Python
Python实现购物车程序
2018/04/16 Python
OPENCV去除小连通区域,去除孔洞的实例讲解
2018/06/21 Python
TensorFlow利用saver保存和提取参数的实例
2018/07/26 Python
python 画二维、三维点之间的线段实现方法
2019/07/07 Python
基于python的itchat库实现微信聊天机器人(推荐)
2019/10/29 Python
Python pip install之SSL异常处理操作
2020/09/03 Python
用python对excel进行操作(读,写,修改)
2020/12/25 Python
巴西购物网站:Estrela10
2018/12/13 全球购物
质检的岗位职责
2013/11/17 职场文书
班级聚会策划书
2014/01/16 职场文书
四风存在的原因分析
2014/02/11 职场文书
六五普法规划实施方案
2014/03/21 职场文书
小学假期安全广播稿
2014/09/28 职场文书
学校师德师风整改措施
2014/10/27 职场文书
2015年部门工作总结范文
2015/03/31 职场文书
Pytorch数据读取之Dataset和DataLoader知识总结
2021/05/23 Python
winserver2019安装软件一直卡在应用程序正在为首次使用做准备
2022/06/10 Servers
box-shadow单边阴影的实现
2023/05/21 HTML / CSS