python爬虫快速响应服务器的做法


Posted in Python onNovember 24, 2020

不论是打开网页或者爬取一些资料的时候,我们想要的是计算机能在最短的时间内运行出结果,不然等待的时间过长会影响下一步工作的计划。这时候我们可以给计算机一个指令,限制最久能等待的时间,在我们能接受的时间内运行出结果。那么这个指令方法是什么呢?接下来我们一起看看吧。

requests之所以称为“HTTP for human”,因为其封装层次很高,其中一处体现就在:requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候,搜狗搜索列表页面的公众号文章地址,其实不是微信的地址而需要请求到搜狗到服务器做重定向,而requests的默认处理则是将整个过程全部搞定,对此可以这样:

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外,有时候对方网站的响应时间太长了,我们希望在指定时间内完事,或者直接停止这个请求,这时候的做法是:

In [1]: r = requests.get('http://xlzd.me', timeout=3)

timeout表示这次请求最长我最长只等待多少秒

拓展:

为requests套上一层代理的做法也非常简单:

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

到此这篇关于python爬虫快速响应服务器的做法的文章就介绍到这了,更多相关python爬虫中如何快速响应服务器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 列表递归求和、计数、求最大元素的实例
Nov 28 Python
Python如何爬取实时变化的WebSocket数据的方法
Mar 09 Python
Python实现打砖块小游戏代码实例
May 18 Python
浅谈PySpark SQL 相关知识介绍
Jun 14 Python
Python Django 实现简单注册功能过程详解
Jul 29 Python
Python 调用 Outlook 发送邮件过程解析
Aug 08 Python
Python+Kepler.gl实现时间轮播地图过程解析
Jul 20 Python
Python 执行矩阵与线性代数运算
Aug 01 Python
Python+Selenium随机生成手机验证码并检查页面上是否弹出重复手机号码提示框
Sep 21 Python
python实现猜拳游戏项目
Nov 30 Python
详解Python中@staticmethod和@classmethod区别及使用示例代码
Dec 14 Python
python 中的@运算符使用
May 26 Python
PyCharm Community安装与配置的详细教程
Nov 24 #Python
python3爬虫GIL修改多线程实例讲解
Nov 24 #Python
Django URL参数Template反向解析
Nov 24 #Python
python3爬虫中引用Queue的实例讲解
Nov 24 #Python
python3爬虫中多线程的优势总结
Nov 24 #Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 #Python
python 如何停止一个死循环的线程
Nov 24 #Python
You might like
关于mysql字符集设置了character_set_client=binary 在gbk情况下会出现表描述是乱码的情况
2013/01/06 PHP
PHP curl实现抓取302跳转后页面的示例
2014/07/04 PHP
PHP编译安装中遇到的两个错误和解决方法
2014/08/20 PHP
php实现的树形结构数据存取类实例
2014/11/29 PHP
PHP编程入门的基本语法知识点总结
2016/01/26 PHP
PHP PDOStatement::errorCode讲解
2019/01/31 PHP
php探针使用原理和技巧讲解
2019/09/17 PHP
php给数组赋值的实例方法
2019/09/26 PHP
laravel框架模型中非静态方法也能静态调用的原理分析
2019/11/23 PHP
jquery 输入框数字限制插件
2009/11/10 Javascript
javascript/jquery获取地址栏url参数的方法
2014/03/05 Javascript
swtich/if...else的替代语句
2015/08/16 Javascript
JQuery实现左右滚动菜单特效
2015/09/28 Javascript
JavaScript+html5 canvas制作的百花齐放效果完整实例
2016/01/26 Javascript
Angular.js中ng-include用法及多标签页面的实现方式详解
2017/05/07 Javascript
Vue拖拽组件开发实例详解
2018/05/11 Javascript
vue使用video.js进行视频播放功能
2019/07/18 Javascript
axios 实现post请求时把对象obj数据转为formdata
2019/10/31 Javascript
Node.js 深度调试方法解析
2020/07/28 Javascript
Python+Pyqt实现简单GUI电子时钟
2021/02/22 Python
Python的Django框架实现数据库查询(不返回QuerySet的方法)
2020/05/19 Python
python在CMD界面读取excel所有数据的示例
2020/09/28 Python
Numpy中np.max的用法及np.maximum区别
2020/11/27 Python
html5中使用hotcss.js实现手机端自适配的方法
2020/04/23 HTML / CSS
北美最大的参茸药食商城:德成行
2020/12/06 全球购物
什么是Linux虚拟文件系统VFS
2015/08/25 面试题
护士的自我鉴定
2014/02/07 职场文书
手工社团活动方案
2014/02/17 职场文书
服务口号大全
2014/06/11 职场文书
班组拓展活动方案
2014/08/14 职场文书
高考作弊检讨书1500字
2015/02/16 职场文书
2015年度班主任自我评价
2015/03/11 职场文书
文明礼仪倡议书
2015/04/28 职场文书
律师函格式范本
2015/05/27 职场文书
2016重阳节红领巾广播稿
2015/12/18 职场文书
会计手工模拟做账心得体会
2016/01/22 职场文书