python爬虫添加请求头代码实例


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

request

import requests


headers = {
  # 'Accept': 'application/json, text/javascript, */*; q=0.01',
  # 'Accept': '*/*',
  # 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-US;q=0.7',
  # 'Cache-Control': 'no-cache',
  # 'accept-encoding': 'gzip, deflate, br',
  'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36',
  'Referer': 'https://www.google.com/'
}

resp = requests.get('http://httpbin.org/get', headers=headers)
print(resp.content)

urllib

import urllib, urllib2
def get_page_source(url):
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  req = urllib2.Request(url, None, headers)
  response = urllib2.urlopen(req)
  page_source = response.read()
  return page_source

phantomjs请求页面

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
def get_headers_driver():
  desire = DesiredCapabilities.PHANTOMJS.copy()
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  for key, value in headers.iteritems():
    desire['phantomjs.page.customHeaders.{}'.format(key)] = value
  driver = webdriver.PhantomJS(desired_capabilities=desire, service_args=['--load-images=yes'])#将yes改成no可以让浏览器不加载图片
  return driver

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中logging模块的用法实例
Sep 29 Python
Python中用函数作为返回值和实现闭包的教程
Apr 27 Python
python获取当前日期和时间的方法
Apr 30 Python
python中__slots__用法实例
Jun 04 Python
python与sqlite3实现解密chrome cookie实例代码
Jan 20 Python
Python实现PS滤镜特效之扇形变换效果示例
Jan 26 Python
使用Python实现一个栈判断括号是否平衡
Aug 23 Python
python 将字符串中的数字相加求和的实现
Jul 18 Python
Python学习笔记之列表和成员运算符及列表相关方法详解
Aug 22 Python
Python使用psutil获取进程信息的例子
Dec 17 Python
Python命令行click参数用法解析
Dec 19 Python
Python使用pyexecjs代码案例解析
Jul 13 Python
python使用rsa非对称加密过程解析
Dec 28 #Python
Python遍历字典方式就实例详解
Dec 28 #Python
python基于opencv检测程序运行效率
Dec 28 #Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 #Python
Pytorch 多维数组运算过程的索引处理方式
Dec 27 #Python
Pytorch 之修改Tensor部分值方式
Dec 27 #Python
pytorch 实现tensor与numpy数组转换
Dec 27 #Python
You might like
PHP概述.
2006/10/09 PHP
php cache类代码(php数据缓存类)
2010/04/15 PHP
允许phpmyadmin空密码登录的配置方法
2011/05/29 PHP
用Greasemonkey 脚本收藏网站会员信息到本地
2009/10/26 Javascript
jquery 操作DOM的基本用法分享
2012/04/05 Javascript
JavaScript表达式:URL 协议介绍
2013/03/10 Javascript
jQuery之ajax技术的详细介绍
2013/06/19 Javascript
JavaScript实现的使用键盘控制人物走动实例
2014/08/27 Javascript
js实现模拟银行卡账号输入显示效果
2015/11/18 Javascript
深入理解JS函数的参数(arguments)的使用
2016/05/28 Javascript
headjs实现网站并行加载但顺序执行JS
2016/11/29 Javascript
javascript实现将数字转成千分位的方法小结【5种方式】
2016/12/11 Javascript
JavaScript中的高级函数
2018/01/04 Javascript
video.js 一个页面同时播放多个视频的实例代码
2018/11/27 Javascript
用JS实现一个简单的打砖块游戏
2019/12/11 Javascript
解决Vue 刷新页面导航显示高亮位置不对问题
2019/12/25 Javascript
在博客园博文中添加自定义右键菜单的方法详解
2020/02/05 Javascript
JS面向对象编程基础篇(一) 对象和构造函数实例详解
2020/03/03 Javascript
vue 获取url里参数的两种方法小结
2020/11/12 Javascript
解决Vue-cli3没有vue.config.js文件夹及配置vue项目域名的问题
2020/12/04 Vue.js
利用Python脚本在Nginx和uwsgi上部署MoinMoin的教程
2015/05/05 Python
Python实现简单的四则运算计算器
2016/11/02 Python
Python numpy实现二维数组和一维数组拼接的方法
2018/06/05 Python
Numpy中np.max的用法及np.maximum区别
2020/11/27 Python
浅谈Selenium 控制浏览器的常用方法
2020/12/04 Python
外包公司软件测试工程师
2014/11/01 面试题
Python的两道面试题
2013/06/29 面试题
党员对照检查材料思想汇报
2014/09/16 职场文书
工伤事故赔偿协议书(标准)
2014/09/29 职场文书
生日答谢词
2015/01/05 职场文书
督导岗位职责
2015/02/04 职场文书
2015年人民调解工作总结
2015/05/18 职场文书
《水上飞机》教学反思
2016/02/20 职场文书
css3 利用transform-origin 实现圆点分布在大圆上布局及旋转特效
2021/04/29 HTML / CSS
新手入门Mysql--概念
2021/06/18 MySQL
python可视化分析绘制带趋势线的散点图和边缘直方图
2022/06/25 Python