python爬虫快速响应服务器的做法


Posted in Python onNovember 24, 2020

不论是打开网页或者爬取一些资料的时候,我们想要的是计算机能在最短的时间内运行出结果,不然等待的时间过长会影响下一步工作的计划。这时候我们可以给计算机一个指令,限制最久能等待的时间,在我们能接受的时间内运行出结果。那么这个指令方法是什么呢?接下来我们一起看看吧。

requests之所以称为“HTTP for human”,因为其封装层次很高,其中一处体现就在:requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候,搜狗搜索列表页面的公众号文章地址,其实不是微信的地址而需要请求到搜狗到服务器做重定向,而requests的默认处理则是将整个过程全部搞定,对此可以这样:

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外,有时候对方网站的响应时间太长了,我们希望在指定时间内完事,或者直接停止这个请求,这时候的做法是:

In [1]: r = requests.get('http://xlzd.me', timeout=3)

timeout表示这次请求最长我最长只等待多少秒

拓展:

为requests套上一层代理的做法也非常简单:

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

到此这篇关于python爬虫快速响应服务器的做法的文章就介绍到这了,更多相关python爬虫中如何快速响应服务器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python MySQLdb模块连接操作mysql数据库实例
Apr 08 Python
Python 登录网站详解及实例
Apr 11 Python
django2 快速安装指南分享
Jan 05 Python
详解python异步编程之asyncio(百万并发)
Jul 07 Python
Linux下python3.6.1环境配置教程
Sep 26 Python
python numpy 反转 reverse示例
Dec 04 Python
Python列表操作方法详解
Feb 09 Python
Python paramiko 模块浅谈与SSH主要功能模拟解析
Feb 29 Python
Python多线程Threading、子线程与守护线程实例详解
Mar 24 Python
python3从网络摄像机解析mjpeg http流的示例
Nov 13 Python
关于Numpy之repeat、tile的用法总结
Jun 02 Python
Python制作春联的示例代码
Jan 22 Python
PyCharm Community安装与配置的详细教程
Nov 24 #Python
python3爬虫GIL修改多线程实例讲解
Nov 24 #Python
Django URL参数Template反向解析
Nov 24 #Python
python3爬虫中引用Queue的实例讲解
Nov 24 #Python
python3爬虫中多线程的优势总结
Nov 24 #Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 #Python
python 如何停止一个死循环的线程
Nov 24 #Python
You might like
PHP学习笔记 IIS7下安装配置php环境
2012/10/29 PHP
有道搜索和IP138的IP的API接口(PHP应用)
2012/11/29 PHP
CI(CodeIgniter)框架视图中加载视图的方法
2017/03/24 PHP
php web环境和命令行环境下查找php.ini的位置
2019/07/17 PHP
jquery插件 cluetip 关键词注释
2010/01/12 Javascript
使用JQuery进行跨域请求
2010/01/25 Javascript
javascript强大的日期函数代码分享
2013/09/04 Javascript
JavaScript子类用Object.getPrototypeOf去调用父类方法解析
2013/12/05 Javascript
JS+CSS实现带关闭按钮DIV弹出窗口的方法
2015/02/27 Javascript
JS判断网页广告是否被浏览器拦截过滤的代码
2015/04/05 Javascript
nodejs爬虫抓取数据之编码问题
2015/07/03 NodeJs
详解express与koa中间件模式对比
2017/08/07 Javascript
11行JS代码制作二维码生成功能
2018/03/09 Javascript
[04:37]DOTA2英雄梦之声Vol20发条
2014/06/20 DOTA
Python使用设计模式中的责任链模式与迭代器模式的示例
2016/03/02 Python
python3 与python2 异常处理的区别与联系
2016/06/19 Python
深入解答关于Python的11道基本面试题
2017/04/01 Python
Python中装饰器高级用法详解
2017/12/25 Python
python中kmeans聚类实现代码
2018/02/23 Python
对Python 窗体(tkinter)文本编辑器(Text)详解
2018/10/11 Python
详解python 爬取12306验证码
2019/05/10 Python
python 两个数据库postgresql对比
2019/10/21 Python
python shapely.geometry.polygon任意两个四边形的IOU计算实例
2020/04/12 Python
浅谈关于html5中图片抛物线运动的一些心得
2018/01/09 HTML / CSS
某IT外企面试题-二分法求方程!看看大家的C++功底
2015/07/04 面试题
进修护士自我鉴定
2013/10/14 职场文书
师范院校学生自荐信范文
2013/12/27 职场文书
给老婆的保证书范文
2014/04/28 职场文书
领导班子遵守党的政治纪律情况对照检查材料
2014/09/26 职场文书
KTV门卫岗位职责
2014/10/09 职场文书
2014年保卫部工作总结
2014/11/21 职场文书
辞职信范文大全
2015/03/02 职场文书
迎新生欢迎词2015
2015/07/16 职场文书
Python中requests做接口测试的方法
2021/05/30 Python
浅谈MySQL表空间回收的正确姿势
2021/10/05 MySQL
基于Redis zSet实现滑动窗口对短信进行防刷限流的问题
2022/02/12 Redis