Python爬虫之UserAgent的使用实例


Posted in Python onFebruary 21, 2019

问题: 在Python爬虫的过程中经常要模拟UserAgent, 因此自动生成UserAgent十分有用, 最近看到一个Python库(fake-useragent),可以随机生成各种UserAgent, 在这里记录一下, 留给自己爬虫使用。

安装 pip install fake-useragent

使用案例

基本使用

from fake_useragent import UserAgent
ua = UserAgent()
ua.ie
# Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US);
ua.msie
# Mozilla/5.0 (compatible; MSIE 10.0; Macintosh; Intel Mac OS X 10_7_3; Trident/6.0)'
ua['Internet Explorer']
# Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; GTB7.4; InfoPath.2; SV1; .NET CLR 3.3.69573; WOW64; en-US)
ua.opera
# Opera/9.80 (X11; Linux i686; U; ru) Presto/2.8.131 Version/11.11
ua.chrome
# Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, like Gecko) Chrome/22.0.1216.0 Safari/537.2'
ua.google
# Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1290.1 Safari/537.13
ua['google chrome']
# Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11
ua.firefox
# Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1
ua.ff
# Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:15.0) Gecko/20100101 Firefox/15.0.1
ua.safari
# Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25
# and the best one, random via real world browser usage statistic
ua.random

注意:

fake-useragent 将收集到的数据缓存到temp文件夹, 例如 /tmp, 更新数据:

from fake_useragent import UserAgent
ua = UserAgent()
ua.update()

有时候会因为网络或者其他问题,出现异常(fake_useragent.errors.FakeUserAgentError: Maximum amount of retries reached), 可以禁用服务器缓存(从这里踩了一个坑, 没仔细看文档的锅):

from fake_useragent import UserAgent
ua = UserAgent(use_cache_server=False)

可以自己添加本地数据文件(v0.1.4+)

import fake_useragent
# I am STRONGLY!!! recommend to use version suffix
location = '/home/user/fake_useragent%s.json' % fake_useragent.VERSION
ua = fake_useragent.UserAgent(path=location)
ua.random

其他功能用到的也不是很多,详细见文档吧。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python 生成目录树及显示文件大小的代码
Jul 23 Python
教你学会使用Python正则表达式
Sep 07 Python
Python数据类型中的“冒号“[::]——分片与步长操作示例
Jan 24 Python
python实现微信发送邮件关闭电脑功能
Feb 22 Python
Python 解决中文写入Excel时抛异常的问题
May 03 Python
Python爬虫获取图片并下载保存至本地的实例
Jun 01 Python
Python学习笔记之图片人脸检测识别实例教程
Mar 06 Python
pyqt5 textEdit、lineEdit操作的示例代码
Aug 12 Python
python和C++共享内存传输图像的示例
Oct 27 Python
pycharm 配置svn的图文教程(手把手教你)
Jan 15 Python
Python爬虫实例之2021猫眼票房字体加密反爬策略(粗略版)
Feb 22 Python
Python 快速验证代理IP是否有效的方法实现
Jul 15 Python
利用python实现在微信群刷屏的方法
Feb 21 #Python
Python实现微信自动好友验证,自动回复,发送群聊链接方法
Feb 21 #Python
使用python itchat包爬取微信好友头像形成矩形头像集的方法
Feb 21 #Python
对python借助百度云API对评论进行观点抽取的方法详解
Feb 21 #Python
用python实现刷点击率的示例代码
Feb 21 #Python
Python快速转换numpy数组中Nan和Inf的方法实例说明
Feb 21 #Python
python根据文章标题内容自动生成摘要的实例
Feb 21 #Python
You might like
国产动画《伍六七》原声大碟大卖,啊哈娱乐引领音乐赋能IP的新尝试
2020/03/08 国漫
php中XMLHttpRequest(Ajax)不能设置自定义的Referer的解决方法
2011/11/26 PHP
destoon在360浏览器下出现用户被强行注销的解决方法
2014/06/26 PHP
PHP处理会话函数大总结
2015/08/05 PHP
PHP+AJAX实现投票功能的方法
2015/09/28 PHP
Yii框架表单提交验证功能分析
2017/01/07 PHP
php的优点总结 php有哪些优点
2019/07/19 PHP
jQuery-ui引入后Vs2008的无智能提示问题解决方法
2014/02/10 Javascript
jquery 无限级下拉菜单的简单实现代码
2014/02/21 Javascript
Javascript变量的作用域和作用域链详解
2015/04/02 Javascript
跟我学习javascript的函数和函数表达式
2015/11/16 Javascript
javascript cookie的简单应用
2016/02/24 Javascript
总结在前端排序中遇到的问题
2016/07/19 Javascript
highcharts 在angular中的使用示例代码
2017/09/20 Javascript
爬虫利器Puppeteer实战
2019/01/09 Javascript
Vue多组件仓库开发与发布详解
2019/02/28 Javascript
js实现随机div颜色位置 类似满天星效果
2019/10/24 Javascript
微信小程序服务器日期格式化问题
2020/01/07 Javascript
JavaScript简单编程实例学习
2020/02/14 Javascript
python以环状形式组合排列图片并输出的方法
2015/03/17 Python
Linux RedHat下安装Python2.7开发环境
2017/05/20 Python
Python3的介绍、安装和命令行的认识(推荐)
2018/10/20 Python
python读取txt文件,去掉空格计算每行长度的方法
2018/12/20 Python
Python 根据数据模板创建shapefile的实现
2019/11/26 Python
Python zip函数打包元素实例解析
2019/12/11 Python
python中plt.imshow与cv2.imshow显示颜色问题
2020/07/16 Python
pymongo insert_many 批量插入的实例
2020/12/05 Python
HTML5播放实现rtmp流直播
2020/06/16 HTML / CSS
新加坡最佳婴儿用品店:Mamahood.com.sg
2018/08/26 全球购物
有趣、实用和鼓舞人心的产品:Inspire Uplift
2019/11/05 全球购物
YII2 全局异常处理深入讲解
2021/03/24 PHP
团支部组织委员竞选稿
2015/11/21 职场文书
SQLServer2019 数据库的基本使用之图形化界面操作的实现
2021/04/08 SQL Server
Python标准库之typing的用法(类型标注)
2021/06/02 Python
MongoDB 常用的crud操作语句
2021/06/20 MongoDB
OpenCV绘制圆端矩形的示例代码
2021/08/30 Python