python爬虫添加请求头代码实例


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

request

import requests


headers = {
  # 'Accept': 'application/json, text/javascript, */*; q=0.01',
  # 'Accept': '*/*',
  # 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-US;q=0.7',
  # 'Cache-Control': 'no-cache',
  # 'accept-encoding': 'gzip, deflate, br',
  'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36',
  'Referer': 'https://www.google.com/'
}

resp = requests.get('http://httpbin.org/get', headers=headers)
print(resp.content)

urllib

import urllib, urllib2
def get_page_source(url):
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  req = urllib2.Request(url, None, headers)
  response = urllib2.urlopen(req)
  page_source = response.read()
  return page_source

phantomjs请求页面

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
def get_headers_driver():
  desire = DesiredCapabilities.PHANTOMJS.copy()
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  for key, value in headers.iteritems():
    desire['phantomjs.page.customHeaders.{}'.format(key)] = value
  driver = webdriver.PhantomJS(desired_capabilities=desire, service_args=['--load-images=yes'])#将yes改成no可以让浏览器不加载图片
  return driver

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python的id()函数解密过程
Dec 25 Python
Python实现的检测web服务器健康状况的小程序
Sep 17 Python
用Python进行基础的函数式编程的教程
Mar 31 Python
Python减少循环层次和缩进的技巧分析
Mar 15 Python
Python多进程multiprocessing用法实例分析
Aug 18 Python
python爬虫之xpath的基本使用详解
Apr 18 Python
python SQLAlchemy的Mapping与Declarative详解
Jul 04 Python
VSCode中自动为Python文件添加头部注释
Nov 14 Python
爬虫代理池Python3WebSpider源代码测试过程解析
Dec 20 Python
python DES加密与解密及hex输出和bs64格式输出的实现代码
Apr 13 Python
Django xadmin安装及使用详解
Oct 26 Python
python drf各类组件的用法和作用
Jan 12 Python
python使用rsa非对称加密过程解析
Dec 28 #Python
Python遍历字典方式就实例详解
Dec 28 #Python
python基于opencv检测程序运行效率
Dec 28 #Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 #Python
Pytorch 多维数组运算过程的索引处理方式
Dec 27 #Python
Pytorch 之修改Tensor部分值方式
Dec 27 #Python
pytorch 实现tensor与numpy数组转换
Dec 27 #Python
You might like
PHP 用数组降低程序的时间复杂度
2009/12/04 PHP
php 解决旧系统 查出所有数据分页的类
2012/08/27 PHP
PHP curl 获取响应的状态码的方法
2014/01/13 PHP
微信公众号开发客服接口实例代码
2016/10/21 PHP
PHP实现对文件锁进行加锁、解锁操作的方法
2017/07/04 PHP
ThinkPHP 5.x远程命令执行漏洞复现
2019/09/23 PHP
JavaScript在IE中“意外地调用了方法或属性访问”
2008/11/19 Javascript
js获取元素到文档区域document的(横向、纵向)坐标的两种方法
2013/05/17 Javascript
js为数字添加逗号并格式化数字的代码
2013/08/23 Javascript
JavaScript学习笔记之JS函数
2015/01/22 Javascript
js防刷新的倒计时代码 js倒计时代码
2017/09/06 Javascript
js闭包学习心得总结
2018/04/17 Javascript
AngularJS 前台分页实现的示例代码
2018/06/07 Javascript
NodeJS模块与ES6模块系统语法及注意点详解
2019/01/04 NodeJs
vue数据初始化initState的实例详解
2019/04/11 Javascript
小程序实现日历左右滑动效果
2019/10/21 Javascript
Python3实现从文件中读取指定行的方法
2015/05/22 Python
Python程序运行原理图文解析
2018/02/10 Python
python使用opencv按一定间隔截取视频帧
2018/03/06 Python
详解Python3 中hasattr()、getattr()、setattr()、delattr()函数及示例代码数
2018/04/18 Python
详解pyqt5 动画在QThread线程中无法运行问题
2018/05/05 Python
python sqlite的Row对象操作示例
2019/09/11 Python
python dumps和loads区别详解
2020/02/04 Python
8种常用的Python工具
2020/08/05 Python
Canvas中设置width与height的问题浅析
2018/11/01 HTML / CSS
新西兰最大的在线设计师眼镜店:SmartBuyGlasses新西兰
2017/10/20 全球购物
中学教师实习自我鉴定
2013/09/28 职场文书
办公室前台岗位职责
2014/01/04 职场文书
学术会议主持词
2014/03/17 职场文书
离婚纠纷代理词
2015/05/23 职场文书
秋菊打官司观后感
2015/06/03 职场文书
创业计划书之川味火锅店
2019/09/02 职场文书
JavaScript中关于预编译、作用域链和闭包的理解
2021/03/31 Javascript
使用 Apache Dubbo 实现远程通信(微服务架构)
2022/02/12 Servers
正则表达式拆分url实例代码
2022/02/24 Java/Android
Oracle用户管理及赋权
2022/04/24 Oracle