python爬虫快速响应服务器的做法


Posted in Python onNovember 24, 2020

不论是打开网页或者爬取一些资料的时候,我们想要的是计算机能在最短的时间内运行出结果,不然等待的时间过长会影响下一步工作的计划。这时候我们可以给计算机一个指令,限制最久能等待的时间,在我们能接受的时间内运行出结果。那么这个指令方法是什么呢?接下来我们一起看看吧。

requests之所以称为“HTTP for human”,因为其封装层次很高,其中一处体现就在:requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候,搜狗搜索列表页面的公众号文章地址,其实不是微信的地址而需要请求到搜狗到服务器做重定向,而requests的默认处理则是将整个过程全部搞定,对此可以这样:

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外,有时候对方网站的响应时间太长了,我们希望在指定时间内完事,或者直接停止这个请求,这时候的做法是:

In [1]: r = requests.get('http://xlzd.me', timeout=3)

timeout表示这次请求最长我最长只等待多少秒

拓展:

为requests套上一层代理的做法也非常简单:

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

到此这篇关于python爬虫快速响应服务器的做法的文章就介绍到这了,更多相关python爬虫中如何快速响应服务器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python:socket传输大文件示例
Jan 18 Python
Python中格式化format()方法详解
Apr 01 Python
mysql 之通过配置文件链接数据库
Aug 12 Python
python实现远程通过网络邮件控制计算机重启或关机
Feb 22 Python
Python中循环引用(import)失败的解决方法
Apr 22 Python
python 中字典嵌套列表的方法
Jul 03 Python
python3+PyQt5 数据库编程--增删改实例
Jun 17 Python
python 实现在一张图中绘制一个小的子图方法
Jul 07 Python
如何安装并使用conda指令管理python环境
Jul 10 Python
python模块和包的应用BASE_PATH使用解析
Dec 14 Python
python使用paramiko实现ssh的功能详解
Mar 06 Python
Django 用户认证Auth组件的使用
Nov 30 Python
PyCharm Community安装与配置的详细教程
Nov 24 #Python
python3爬虫GIL修改多线程实例讲解
Nov 24 #Python
Django URL参数Template反向解析
Nov 24 #Python
python3爬虫中引用Queue的实例讲解
Nov 24 #Python
python3爬虫中多线程的优势总结
Nov 24 #Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 #Python
python 如何停止一个死循环的线程
Nov 24 #Python
You might like
PHP 类商品秒杀计时实现代码
2010/05/05 PHP
PHP中数字检测is_numeric与ctype_digit的区别介绍
2012/10/04 PHP
thinkPHP的Html模板标签使用方法
2012/11/13 PHP
详解WordPress中提醒安装插件以及隐藏插件的功能实现
2015/12/25 PHP
php 解决扫描二维码下载跳转问题
2017/01/13 PHP
PHP用正则匹配form表单中所有元素的类型和属性值实例代码
2017/02/28 PHP
php面向对象重点知识分享
2019/09/27 PHP
在次封装easyui-Dialog插件实现代码
2010/11/14 Javascript
js取得url地址参数实例
2013/02/22 Javascript
JavaScript中几个重要的属性(this、constructor、prototype)介绍
2013/05/19 Javascript
Jquery右下角抖动、浮动 实例代码(兼容ie6、FF)
2013/08/15 Javascript
JavaScript获取网页中第一个图片id的方法
2015/04/03 Javascript
JavaScript中 this 指向问题深度解析
2017/02/21 Javascript
详解win7 cmd执行vue不是内部命令的解决方法
2017/07/27 Javascript
JS设计模式之数据访问对象模式的实例讲解
2017/09/30 Javascript
解决使用vue.js路由后失效的问题
2018/03/17 Javascript
利用Electron简单撸一个Markdown编辑器的方法
2019/06/10 Javascript
autojs 蚂蚁森林能量自动拾取即给指定好友浇水的实现方法
2020/05/03 Javascript
[06:59]DOTA2-DPC中国联赛3月7日Recap集锦
2021/03/11 DOTA
使用Python制作获取网站目录的图形化程序
2015/05/04 Python
pandas 选择某几列的方法
2018/07/03 Python
win8下python3.4安装和环境配置图文教程
2018/07/31 Python
Python字符串、整数、和浮点型数相互转换实例
2018/08/04 Python
Python 判断图像是否读取成功的方法
2019/01/26 Python
Python turtle画图库&&画姓名实例
2020/01/19 Python
如何表示python中的相对路径
2020/07/08 Python
Python常用模块函数代码汇总解析
2020/08/31 Python
使用CSS3配合IE滤镜实现渐变和投影的效果
2015/09/06 HTML / CSS
您的网上新华书店:文轩网
2016/08/24 全球购物
全球最受追捧的运动服品牌领先数字目的地:Stylerunner
2020/11/25 全球购物
将一个文本文件的内容按倒序打印出来
2015/01/05 面试题
中国梦的演讲稿
2014/01/08 职场文书
财务内勤岗位职责
2014/04/17 职场文书
婚庆公司计划书
2014/09/15 职场文书
工作收入证明模板
2015/06/12 职场文书
2019年描写人生经典诗句大全
2019/07/08 职场文书