python爬虫模拟浏览器访问-User-Agent过程解析


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python爬虫模拟浏览器访问-User-Agent过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

模拟浏览器访问-User-Agent:

import urllib2

#User-Agent 模拟浏览器访问
headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.88 Safari/537.36"}

#通过urllib2.Request()方法构造一个请求对象
request = urllib2.Request("http://www.baidu.com/",headers = headers)


#向指定的URL地址发送请求,并返回服务器响应的类文件对象
#response是服务器响应的类文件,除了支持文件操作的方法外,还支持以下常用的方法:
response = urllib2.urlopen(request)



#服务器返回的类文件对象支持python文件对象的操作方法
#read()方法就是读取文件里的全部内容,返回字符串
html = response.read()

#返回HTTP的响应码,成功返回200,4服务器页面出错;5.服务器问题
print response.getcode()

#返回实际数据的实际URL,防止重定向问题
print response.geturl()

#返回服务器响应的HTTP报头
print response.info()


#打印响应内容
print(html)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的简单发送邮件脚本分享
Nov 07 Python
Django中模型Model添加JSON类型字段的方法
Jun 17 Python
Python3.4实现从HTTP代理网站批量获取代理并筛选的方法示例
Sep 26 Python
python实现校园网自动登录的示例讲解
Apr 22 Python
Python实现读取机器硬件信息的方法示例
Jun 09 Python
Win10下python 2.7.13 安装配置方法图文教程
Sep 18 Python
python 在屏幕上逐字显示一行字的实例
Dec 24 Python
python和mysql交互操作实例详解【基于pymysql库】
Jun 04 Python
python使用minimax算法实现五子棋
Jul 29 Python
Pytorch中index_select() 函数的实现理解
Nov 19 Python
python实现自动打卡的示例代码
Oct 10 Python
python3使用diagrams绘制架构图的步骤
Apr 08 Python
python爬虫添加请求头代码实例
Dec 28 #Python
python使用rsa非对称加密过程解析
Dec 28 #Python
Python遍历字典方式就实例详解
Dec 28 #Python
python基于opencv检测程序运行效率
Dec 28 #Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 #Python
Pytorch 多维数组运算过程的索引处理方式
Dec 27 #Python
Pytorch 之修改Tensor部分值方式
Dec 27 #Python
You might like
php对gzip文件或者字符串解压实例参考
2008/07/25 PHP
Zend Studio 无法启动的问题解决方法
2008/12/04 PHP
php&mysql 日期操作小记
2012/02/27 PHP
探讨php中防止SQL注入最好的方法是什么
2013/06/10 PHP
深入理解PHP中的Streams工具
2015/07/03 PHP
9个比较实用的php代码片段
2016/03/15 PHP
js从Cookies里面取值的简单实现
2014/06/30 Javascript
jQuery手动点击实现图片轮播特效
2020/04/20 Javascript
jQuery Easyui使用(二)之可折叠面板动态加载无效果的解决方法
2016/08/17 Javascript
详解js运算符单竖杠“|”与“||”的用法和作用介绍
2016/11/04 Javascript
javascript实现延时显示提示框效果
2017/06/01 Javascript
详解Node使用Puppeteer完成一次复杂的爬虫
2018/04/18 Javascript
CentOS7中源码编译安装NodeJS的完整步骤
2018/10/13 NodeJs
Vue修改项目启动端口号方法
2019/11/07 Javascript
js最全的数组的降维5种办法(小结)
2020/04/28 Javascript
python实现代码行数统计示例分享
2014/02/10 Python
python subprocess 杀掉全部派生的子进程方法
2017/01/16 Python
在Python中执行系统命令的方法示例详解
2017/09/14 Python
Python迭代器与生成器用法实例分析
2018/07/09 Python
对python多线程SSH登录并发脚本详解
2019/02/14 Python
python使用flask与js进行前后台交互的例子
2019/07/19 Python
python 接口实现 供第三方调用的例子
2019/08/13 Python
pycharm中导入模块错误时提示Try to run this command from the system terminal
2020/03/26 Python
记一次python 爬虫爬取深圳租房信息的过程及遇到的问题
2020/11/24 Python
台湾网购生鲜第一品牌:i3Fresh爱上新鲜
2017/10/26 全球购物
德国健康生活方式网上商店:Landkaufhaus Mayer
2019/03/12 全球购物
《高尔基和他的儿子》教学反思
2014/04/09 职场文书
股东协议书
2014/04/14 职场文书
承诺书格式
2014/06/03 职场文书
学校领导班子四风对照检查材料
2014/09/27 职场文书
工作业绩不及格检讨书
2014/10/28 职场文书
公务员政审材料范文
2014/12/23 职场文书
2015年数学教师工作总结
2015/05/20 职场文书
入党积极分子考察意见
2015/06/02 职场文书
高质量“欢迎词”
2019/04/03 职场文书
创业计划书之珠宝饰品
2019/08/26 职场文书