Python爬虫之UserAgent的使用实例


Posted in Python onFebruary 21, 2019

问题: 在Python爬虫的过程中经常要模拟UserAgent, 因此自动生成UserAgent十分有用, 最近看到一个Python库(fake-useragent),可以随机生成各种UserAgent, 在这里记录一下, 留给自己爬虫使用。

安装 pip install fake-useragent

使用案例

基本使用

from fake_useragent import UserAgent
ua = UserAgent()
ua.ie
# Mozilla/5.0 (Windows; U; MSIE 9.0; Windows NT 9.0; en-US);
ua.msie
# Mozilla/5.0 (compatible; MSIE 10.0; Macintosh; Intel Mac OS X 10_7_3; Trident/6.0)'
ua['Internet Explorer']
# Mozilla/5.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; GTB7.4; InfoPath.2; SV1; .NET CLR 3.3.69573; WOW64; en-US)
ua.opera
# Opera/9.80 (X11; Linux i686; U; ru) Presto/2.8.131 Version/11.11
ua.chrome
# Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.2 (KHTML, like Gecko) Chrome/22.0.1216.0 Safari/537.2'
ua.google
# Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_4) AppleWebKit/537.13 (KHTML, like Gecko) Chrome/24.0.1290.1 Safari/537.13
ua['google chrome']
# Mozilla/5.0 (X11; CrOS i686 2268.111.0) AppleWebKit/536.11 (KHTML, like Gecko) Chrome/20.0.1132.57 Safari/536.11
ua.firefox
# Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:16.0.1) Gecko/20121011 Firefox/16.0.1
ua.ff
# Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:15.0) Gecko/20100101 Firefox/15.0.1
ua.safari
# Mozilla/5.0 (iPad; CPU OS 6_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/6.0 Mobile/10A5355d Safari/8536.25
# and the best one, random via real world browser usage statistic
ua.random

注意:

fake-useragent 将收集到的数据缓存到temp文件夹, 例如 /tmp, 更新数据:

from fake_useragent import UserAgent
ua = UserAgent()
ua.update()

有时候会因为网络或者其他问题,出现异常(fake_useragent.errors.FakeUserAgentError: Maximum amount of retries reached), 可以禁用服务器缓存(从这里踩了一个坑, 没仔细看文档的锅):

from fake_useragent import UserAgent
ua = UserAgent(use_cache_server=False)

可以自己添加本地数据文件(v0.1.4+)

import fake_useragent
# I am STRONGLY!!! recommend to use version suffix
location = '/home/user/fake_useragent%s.json' % fake_useragent.VERSION
ua = fake_useragent.UserAgent(path=location)
ua.random

其他功能用到的也不是很多,详细见文档吧。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
python图像处理之反色实现方法
May 30 Python
python 3.6 +pyMysql 操作mysql数据库(实例讲解)
Dec 20 Python
python3写的简单本地文件上传服务器实例
Jun 04 Python
mac下如何将python2.7改为python3
Jul 13 Python
python retrying模块的使用方法详解
Sep 25 Python
Python Django2.0集成Celery4.1教程
Nov 19 Python
pytorch 改变tensor尺寸的实现
Jan 03 Python
JupyterNotebook 输出窗口的显示效果调整方法
Apr 13 Python
pytorch cuda上tensor的定义 以及减少cpu的操作详解
Jun 23 Python
如何将anaconda安装配置的mmdetection环境离线拷贝到另一台电脑
Oct 15 Python
matplotlib对象拾取事件处理的实现
Jan 14 Python
Python实现8种常用抽样方法
Jun 27 Python
利用python实现在微信群刷屏的方法
Feb 21 #Python
Python实现微信自动好友验证,自动回复,发送群聊链接方法
Feb 21 #Python
使用python itchat包爬取微信好友头像形成矩形头像集的方法
Feb 21 #Python
对python借助百度云API对评论进行观点抽取的方法详解
Feb 21 #Python
用python实现刷点击率的示例代码
Feb 21 #Python
Python快速转换numpy数组中Nan和Inf的方法实例说明
Feb 21 #Python
python根据文章标题内容自动生成摘要的实例
Feb 21 #Python
You might like
全国FM电台频率大全 - 3 河北省
2020/03/11 无线电
根据中文裁减字符串函数的php代码
2013/12/03 PHP
ThinkPHP结合AjaxFileUploader实现无刷新文件上传的方法
2014/10/29 PHP
CodeIgniter实现从网站抓取图片并自动下载到文件夹里的方法
2015/06/17 PHP
解读IE和firefox下JScript和HREF的执行顺序
2008/01/12 Javascript
jquery入门—数据删除与隔行变色以及图片预览
2013/01/07 Javascript
jquery防止重复执行动画避免页面混乱
2014/04/22 Javascript
几种经典排序算法的JS实现方法
2016/03/25 Javascript
jQuery插件fullPage.js实现全屏滚动效果
2016/12/02 Javascript
解析如何利用iframe标签以及js制作时钟
2016/12/08 Javascript
js正则表达式惰性匹配和贪婪匹配用法分析
2016/12/26 Javascript
通过AngularJS实现图片上传及缩略图展示示例
2017/01/03 Javascript
微信小程序实战之上拉(分页加载)效果(2)
2017/04/17 Javascript
JS对象序列化成json数据和json数据转化为JS对象的代码
2017/08/23 Javascript
js中getter和setter用法实例分析
2018/08/14 Javascript
解决vue A对象赋值给B对象,修改B属性会影响到A的问题
2018/09/25 Javascript
Layui实现数据表格中鼠标悬浮图片放大效果,离开时恢复原图的方法
2019/09/11 Javascript
vue 封装面包屑组件教程
2020/11/16 Javascript
H5 js点击按钮复制文本到粘贴板
2020/11/19 Javascript
Python操作串口的方法
2015/06/17 Python
python将每个单词按空格分开并保存到文件中
2018/03/19 Python
Python数据可视化 pyecharts实现各种统计图表过程详解
2019/08/15 Python
python3中sorted函数里cmp参数改变详解
2020/03/12 Python
python 解决函数返回return的问题
2020/12/05 Python
jupyter notebook更换皮肤主题的实现
2021/01/07 Python
英国人最爱的饰品网站:Accessorize
2016/08/22 全球购物
阿玛尼美妆加拿大官方商城:Giorgio Armani Beauty加拿大
2017/10/24 全球购物
轻松制作精彩视频:Animoto
2018/09/19 全球购物
工作中的自我评价如何写好
2013/10/28 职场文书
简历中求职的个人自我评价
2013/12/03 职场文书
理工学院学生自我鉴定
2014/02/23 职场文书
交通事故赔偿协议书
2014/04/15 职场文书
党员批评与自我批评总结
2014/10/15 职场文书
社区党的群众路线教育实践活动总结材料
2014/10/31 职场文书
推普标语口号大全
2015/12/26 职场文书
Python机器学习算法之决策树算法的实现与优缺点
2021/05/13 Python