python反爬虫方法的优缺点分析


Posted in Python onNovember 25, 2020

我们选择一种问题的解决办法,通常需要考虑到想要达到的效果,还有最重要的是这个办法本身的优缺点有哪些,与其他的方法对比哪一个更好。之前小编之前也教过大家在python应对反爬虫的方法,那么小伙伴们知道具体情况下选择哪一种办法更适合吗?今天就其中的user-agent和ip代码两个办法进行优缺点分析比较,让大家可以明确不同办法的区别从而进行选择。

方法一:

可以自己设置一下user-agent,或者更好的是,可以从一系列的user-agent里随机挑出一个符合标准的使用。

 python反爬虫方法的优缺点分析缺点:

容易伪造头部,github上有人分享开源库fake-useragent

IP限制

如果一个固定的ip在短暂的时间内,快速大量的访问一个网站,后台管理员可以编写IP限制,不让该IP继续访问。

方法二:

比较成熟的方式是:IP代理池

python反爬虫方法的优缺点分析 

简单的说,就是通过ip代理,从不同的ip进行访问,这样就不会被封掉ip了。

可是ip代理的获取本身就是一个很麻烦的事情,网上有免费和付费的,但是质量都层次不齐。如果是企业里需要的话,可以通过自己购买集群云服务来自建代理池。

缺点:

可以使用免费/付费代理,绕过检测。

读完本篇我们会发现,每种方法都有它的缺陷,我们要做的就是发挥使用它的优势出。根据不同的环境情况,可以选择适合自己操作顺手的方法。对于两种方法知识点遗忘的,可以直接点击进去进行回顾。

到此这篇关于python反爬虫方法的优缺点分析的文章就介绍到这了,更多相关python解决反爬虫方法的优缺点对比内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python读取注册表中值的方法
Apr 08 Python
使用Python的Twisted框架实现一个简单的服务器
Apr 16 Python
python函数的5种参数详解
Feb 24 Python
python tensorflow学习之识别单张图片的实现的示例
Feb 09 Python
详谈在flask中使用jsonify和json.dumps的区别
Mar 26 Python
python logging日志模块以及多进程日志详解
Apr 18 Python
pandas的唯一值、值计数以及成员资格的示例
Jul 25 Python
python3 面向对象__类的内置属性与方法的实例代码
Nov 09 Python
Kali Linux安装ipython2 和 ipython3的方法
Jul 11 Python
Python调用.NET库的方法步骤
Dec 27 Python
Python读取VOC中的xml目标框实例
Mar 10 Python
Python Django获取URL中的数据详解
Nov 01 Python
Pytest测试框架基本使用方法详解
Nov 25 #Python
python实现企业微信定时发送文本消息的实例代码
Nov 25 #Python
Python json解析库jsonpath原理及使用示例
Nov 25 #Python
搭建pypi私有仓库实现过程详解
Nov 25 #Python
Python代码覆盖率统计工具coverage.py用法详解
Nov 25 #Python
python 实时调取摄像头的示例代码
Nov 25 #Python
Python存储读取HDF5文件代码解析
Nov 25 #Python
You might like
收音机玩机评测 406 篇视频合集
2020/03/11 无线电
PHP数组排序函数合集 以及它们之间的联系分析
2013/06/27 PHP
php生成EAN_13标准条形码实例
2013/11/13 PHP
php switch语句多个值匹配同一代码块应用示例
2014/07/29 PHP
PHP中一些可以替代正则表达式函数的字符串操作函数
2014/11/17 PHP
php备份数据库类分享
2015/04/14 PHP
php根据日期显示所在星座的方法
2015/07/13 PHP
Redis在Laravel项目中的应用实例详解
2017/08/11 PHP
js加解密 脚本解密
2008/02/22 Javascript
jQuery 性能优化指南(3)
2009/05/21 Javascript
Firefox下提示illegal character并出现乱码的原因
2010/03/25 Javascript
animate 实现滑动切换效果【实例代码】
2016/05/05 Javascript
javascript如何创建对象
2016/08/29 Javascript
详解动画插件wow.js的使用方法
2017/09/13 Javascript
使用vue的transition完成滑动过渡的示例代码
2018/06/25 Javascript
vue-router懒加载速度缓慢问题及解决方法
2018/11/25 Javascript
如何用RxJS实现Redux Form
2018/12/29 Javascript
jQuery实现当拉动滚动条到底部加载数据的方法分析
2019/01/24 jQuery
详解vue中$nextTick和$forceUpdate的用法
2019/12/11 Javascript
JS继承定义与使用方法简单示例
2020/02/19 Javascript
[01:00:14]2018DOTA2亚洲邀请赛 4.6 淘汰赛 VP vs TNC 第三场
2018/04/10 DOTA
使用 Python 实现简单的 switch/case 语句的方法
2018/09/17 Python
python 通过麦克风录音 生成wav文件的方法
2019/01/09 Python
python write无法写入文件的解决方法
2019/01/23 Python
python画图--输出指定像素点的颜色值方法
2019/07/03 Python
python爬取网易云音乐热歌榜实例代码
2020/08/07 Python
pycharm2020.2 配置使用的方法详解
2020/09/16 Python
HTML中使用SVG与SVG预定义形状元素介绍
2013/06/28 HTML / CSS
Html5让容器充满屏幕高度或自适应剩余高度的布局实现
2020/05/14 HTML / CSS
美国孕妇装购物网站:Motherhood Maternity
2019/09/22 全球购物
绝对经典成功的大学生推荐信
2013/11/08 职场文书
医学生临床实习自我评价
2014/03/07 职场文书
运动会铅球比赛加油稿
2014/09/26 职场文书
被委托人身份证明
2015/08/07 职场文书
使用tensorflow 实现反向传播求导
2021/05/26 Python
新手初学Java网络编程
2021/07/07 Java/Android