python爬虫快速响应服务器的做法


Posted in Python onNovember 24, 2020

不论是打开网页或者爬取一些资料的时候,我们想要的是计算机能在最短的时间内运行出结果,不然等待的时间过长会影响下一步工作的计划。这时候我们可以给计算机一个指令,限制最久能等待的时间,在我们能接受的时间内运行出结果。那么这个指令方法是什么呢?接下来我们一起看看吧。

requests之所以称为“HTTP for human”,因为其封装层次很高,其中一处体现就在:requests会自动处理服务器响应的重定向。我在做搜狗微信公众号抓取的时候,搜狗搜索列表页面的公众号文章地址,其实不是微信的地址而需要请求到搜狗到服务器做重定向,而requests的默认处理则是将整个过程全部搞定,对此可以这样:

In [1]: r = requests.get('http://xlzd.me', allow_redirects=False)

allow_redirects参数为False则表示不会主动重定向。

另外,有时候对方网站的响应时间太长了,我们希望在指定时间内完事,或者直接停止这个请求,这时候的做法是:

In [1]: r = requests.get('http://xlzd.me', timeout=3)

timeout表示这次请求最长我最长只等待多少秒

拓展:

为requests套上一层代理的做法也非常简单:

import requests
proxies = {
 "http": "http://192.168.31.1:3128",
 "https": "http://10.10.1.10:1080",
}
requests.get("http://xlzd.me", proxies=proxies)

到此这篇关于python爬虫快速响应服务器的做法的文章就介绍到这了,更多相关python爬虫中如何快速响应服务器内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python使用scrapy采集数据时为每个请求随机分配user-agent的方法
Apr 08 Python
Python中文竖排显示的方法
Jul 28 Python
Python中字符串的修改及传参详解
Nov 30 Python
python使用Tkinter实现在线音乐播放器
Jan 30 Python
python3+PyQt5图形项的自定义和交互 python3实现page Designer应用程序
Jul 20 Python
Python字符串通过'+'和join函数拼接新字符串的性能测试比较
Mar 05 Python
selenium 安装与chromedriver安装的方法步骤
Jun 12 Python
Python中遍历列表的方法总结
Jun 27 Python
pandas中DataFrame修改index、columns名的方法示例
Aug 02 Python
Python imageio读取视频并进行编解码详解
Dec 10 Python
python的scipy.stats模块中正态分布常用函数总结
Feb 19 Python
python 远程执行命令的详细代码
Feb 15 Python
PyCharm Community安装与配置的详细教程
Nov 24 #Python
python3爬虫GIL修改多线程实例讲解
Nov 24 #Python
Django URL参数Template反向解析
Nov 24 #Python
python3爬虫中引用Queue的实例讲解
Nov 24 #Python
python3爬虫中多线程的优势总结
Nov 24 #Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
Nov 24 #Python
python 如何停止一个死循环的线程
Nov 24 #Python
You might like
供参考的 php 学习提高路线分享
2011/10/23 PHP
PHP file_exists问题杂谈
2012/05/07 PHP
PHP使用ob_start生成html页面的方法
2014/11/07 PHP
[原创]PHP实现逐行删除文件右侧空格的方法
2015/12/25 PHP
PHP cookie与session会话基本用法实例分析
2019/11/18 PHP
基于ThinkPHP删除目录及目录文件函数
2020/10/28 PHP
javascript+dom树型菜单类,希望朋友们一起进步
2007/05/03 Javascript
Dom操作之兼容技巧分享
2011/09/20 Javascript
js或者jquery判断图片是否加载完成实现代码
2013/03/20 Javascript
js实现点击图片将图片地址复制到粘贴板的方法
2015/02/16 Javascript
JS实现的简单拖拽功能示例
2017/03/13 Javascript
JS module的导出和导入的实现代码
2019/02/25 Javascript
简单了解微信小程序的目录结构
2019/07/01 Javascript
vue+element项目中过滤输入框特殊字符小结
2019/08/07 Javascript
JS中作用域以及变量范围分析
2020/07/18 Javascript
vue-quill-editor插入图片路径太长问题解决方法
2021/01/08 Vue.js
[01:04:30]Fnatic vs Mineski 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/18 DOTA
python 参数列表中的self 显式不等于冗余
2008/12/01 Python
Python的Django框架中的Context使用
2015/07/15 Python
使用apidoc管理RESTful风格Flask项目接口文档方法
2018/02/07 Python
python+logging+yaml实现日志分割
2019/07/22 Python
树莓派4B+opencv4+python 打开摄像头的实现方法
2019/10/18 Python
python GUI库图形界面开发之PyQt5线程类QThread详细使用方法
2020/02/26 Python
pycharm 使用tab跳出正在编辑的括号(){}{}等问题
2021/02/26 Python
英国领先的露营和露营车品牌之一:OLPRO
2019/08/06 全球购物
几道PHP的面试题
2012/05/19 面试题
怎么处理XML的中文问题
2015/03/26 面试题
HttpServlet类中的主要方法都有哪些?各自的作用是什么?
2014/03/16 面试题
关于工资低的辞职信
2014/01/14 职场文书
市场部经理岗位职责
2014/04/10 职场文书
交通事故赔偿协议书范本
2014/04/15 职场文书
法英专业大学生职业生涯规划范文:衡外情,量己力!
2014/09/23 职场文书
离婚财产分隔协议书
2014/10/23 职场文书
创业计划书之寿司
2019/07/19 职场文书
用Python进行栅格数据的分区统计和批量提取
2021/05/27 Python
使用CSS设置滚动条样式
2022/01/18 HTML / CSS