python爬虫快速响应服务器的做法


Posted in Python onNovember 24, 2020

不论是打开网页或者爬取一些资料的时候,我们想要的是计算机能在最短的时间内运行出结果,不然等待的时间过长会影响下一步工作的计划。这时候我们可以给计算机一个指令,限制最久能等待的时间,在我们能接受的时间内运行出结果。那么这个指令方法是什么呢?接下来我们一起看看吧。

requests之所以称为“HTTP for human”,因为其封装层次很高,其中一处体现就在:requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候,搜狗搜索列表页面的公众号文章地址,其实不是微信的地址而需要请求到搜狗到服务器做重定向,而requests的默认处理则是将整个过程全部搞定,对此可以这样:

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外,有时候对方网站的响应时间太长了,我们希望在指定时间内完事,或者直接停止这个请求,这时候的做法是:

In [1]: r = requests.get('http://xlzd.me', timeout=3)

timeout表示这次请求最长我最长只等待多少秒

拓展:

为requests套上一层代理的做法也非常简单:

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

到此这篇关于python爬虫快速响应服务器的做法的文章就介绍到这了,更多相关python爬虫中如何快速响应服务器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python文件和目录操作方法大全(含实例)
Mar 12 Python
python处理文本文件并生成指定格式的文件
Jul 31 Python
python基于隐马尔可夫模型实现中文拼音输入
Apr 01 Python
Python如何生成树形图案
Jan 03 Python
对numpy中轴与维度的理解
Apr 18 Python
对Python闭包与延迟绑定的方法详解
Jan 07 Python
Python正则表达式匹配和提取IP地址
Jun 06 Python
Python中bisect的使用方法
Dec 31 Python
Pycharm及python安装详细步骤及PyCharm配置整理(推荐)
Jul 31 Python
利用Python制作动态排名图的实现代码
Apr 09 Python
python实现AHP算法的方法实例(层次分析法)
Sep 09 Python
利用Python判断你的密码难度等级
Jun 02 Python
PyCharm Community安装与配置的详细教程
Nov 24 #Python
python3爬虫GIL修改多线程实例讲解
Nov 24 #Python
Django URL参数Template反向解析
Nov 24 #Python
python3爬虫中引用Queue的实例讲解
Nov 24 #Python
python3爬虫中多线程的优势总结
Nov 24 #Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 #Python
python 如何停止一个死循环的线程
Nov 24 #Python
You might like
mysqli_set_charset和SET NAMES使用抉择及优劣分析
2013/01/13 PHP
『PHP』PHP截断函数mb_substr()使用介绍
2013/04/22 PHP
学习php开源项目的源码指南
2014/12/21 PHP
php实现的XML操作(读取)封装类完整实例
2017/02/23 PHP
PHP中让json_encode不自动转义斜杠“/”的方法
2017/02/28 PHP
MooBox 基于Mootools的对话框插件
2012/01/20 Javascript
JS+css 图片自动缩放自适应大小
2013/08/08 Javascript
使用phantomjs进行网页抓取的实现代码
2014/09/29 Javascript
javascript折半查找详解
2015/01/26 Javascript
Jquery操作Ajax方法小结
2015/11/29 Javascript
jQuery使用DataTable实现删除数据后重新加载功能
2017/02/27 Javascript
微信小程序教程系列之新建页面(4)
2017/04/17 Javascript
Mui使用jquery并且使用点击跳转新窗口的实例
2017/08/19 jQuery
json解析大全 双引号、键值对不在一起的情况
2019/12/06 Javascript
使用webpack和rollup打包组件库的方法
2021/02/25 Javascript
分享15个最受欢迎的Python开源框架
2014/07/13 Python
浅析python中SQLAlchemy排序的一个坑
2017/02/24 Python
Python内置模块logging用法实例分析
2018/02/12 Python
利用python如何处理百万条数据(适用java新手)
2018/06/06 Python
Selenium鼠标与键盘事件常用操作方法示例
2018/08/13 Python
Python rstrip()方法实例详解
2018/11/11 Python
python处理multipart/form-data的请求方法
2018/12/26 Python
python实现年会抽奖程序
2019/01/22 Python
Python如何优雅获取本机IP方法
2019/11/10 Python
python 实现两个线程交替执行
2020/05/02 Python
python中sort sorted reverse reversed函数的区别说明
2020/05/11 Python
Python字典dict常用方法函数实例
2020/11/09 Python
HTML5适合的情人节礼物有纪念日期功能
2021/01/25 HTML / CSS
Dr. Martens马汀博士澳大利亚官网:马丁靴鼻祖
2019/07/02 全球购物
冰淇淋店的创业计划书
2014/02/07 职场文书
省级优秀班集体申报材料
2014/05/25 职场文书
主要领导对照检查材料
2014/08/26 职场文书
综治工作心得体会
2014/09/11 职场文书
第二批党的群众路线教育实践活动个人对照检查材料
2014/09/23 职场文书
民事和解协议书格式
2014/11/29 职场文书
python全面解析接口返回数据
2022/02/12 Python