编程 Python

python爬虫添加请求头代码实例

Posted in Python onDecember 28, 2019

这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

request

import requests


headers = {
  # 'Accept': 'application/json, text/javascript, */*; q=0.01',
  # 'Accept': '*/*',
  # 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-US;q=0.7',
  # 'Cache-Control': 'no-cache',
  # 'accept-encoding': 'gzip, deflate, br',
  'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36',
  'Referer': 'https://www.google.com/'
}

resp = requests.get('http://httpbin.org/get', headers=headers)
print(resp.content)

urllib

import urllib, urllib2
def get_page_source(url):
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  req = urllib2.Request(url, None, headers)
  response = urllib2.urlopen(req)
  page_source = response.read()
  return page_source

phantomjs请求页面

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
def get_headers_driver():
  desire = DesiredCapabilities.PHANTOMJS.copy()
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  for key, value in headers.iteritems():
    desire['phantomjs.page.customHeaders.{}'.format(key)] = value
  driver = webdriver.PhantomJS(desired_capabilities=desire, service_args=['--load-images=yes'])#将yes改成no可以让浏览器不加载图片
  return driver

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python爬虫添加请求头代码实例

- Author -

Lust4Life

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python中logging模块的用法实例

Sep 29 Python

Python中用函数作为返回值和实现闭包的教程

Apr 27 Python

python获取当前日期和时间的方法

Apr 30 Python

python中__slots__用法实例

Jun 04 Python

python与sqlite3实现解密chrome cookie实例代码

Jan 20 Python

Python实现PS滤镜特效之扇形变换效果示例

Jan 26 Python

使用Python实现一个栈判断括号是否平衡

Aug 23 Python

python 将字符串中的数字相加求和的实现

Jul 18 Python

Python学习笔记之列表和成员运算符及列表相关方法详解

Aug 22 Python

Python使用psutil获取进程信息的例子

Dec 17 Python

Python命令行click参数用法解析

Dec 19 Python

Python使用pyexecjs代码案例解析

Jul 13 Python

python使用rsa非对称加密过程解析

Dec 28 #Python

Python遍历字典方式就实例详解

Dec 28 #Python

python基于opencv检测程序运行效率

Dec 28 #Python

把vgg-face.mat权重迁移到pytorch模型示例

Dec 27 #Python

Pytorch 多维数组运算过程的索引处理方式

Dec 27 #Python

Pytorch 之修改Tensor部分值方式

Dec 27 #Python

pytorch 实现tensor与numpy数组转换

Dec 27 #Python

You might like

PHP概述.

2006/10/09 PHP

php cache类代码(php数据缓存类)

2010/04/15 PHP

允许phpmyadmin空密码登录的配置方法

2011/05/29 PHP

用Greasemonkey 脚本收藏网站会员信息到本地

2009/10/26 Javascript

jquery 操作DOM的基本用法分享

2012/04/05 Javascript

JavaScript表达式:URL 协议介绍

2013/03/10 Javascript

jQuery之ajax技术的详细介绍

2013/06/19 Javascript

JavaScript实现的使用键盘控制人物走动实例

2014/08/27 Javascript

js实现模拟银行卡账号输入显示效果

2015/11/18 Javascript

深入理解JS函数的参数(arguments)的使用

2016/05/28 Javascript

headjs实现网站并行加载但顺序执行JS

2016/11/29 Javascript

javascript实现将数字转成千分位的方法小结【5种方式】

2016/12/11 Javascript

JavaScript中的高级函数

2018/01/04 Javascript

video.js 一个页面同时播放多个视频的实例代码

2018/11/27 Javascript

用JS实现一个简单的打砖块游戏

2019/12/11 Javascript

解决Vue 刷新页面导航显示高亮位置不对问题

2019/12/25 Javascript

在博客园博文中添加自定义右键菜单的方法详解

2020/02/05 Javascript

JS面向对象编程基础篇（一）对象和构造函数实例详解

2020/03/03 Javascript

vue 获取url里参数的两种方法小结

2020/11/12 Javascript

解决Vue-cli3没有vue.config.js文件夹及配置vue项目域名的问题

2020/12/04 Vue.js

利用Python脚本在Nginx和uwsgi上部署MoinMoin的教程

2015/05/05 Python

Python实现简单的四则运算计算器

2016/11/02 Python

Python numpy实现二维数组和一维数组拼接的方法

2018/06/05 Python

Numpy中np.max的用法及np.maximum区别

2020/11/27 Python

浅谈Selenium 控制浏览器的常用方法

2020/12/04 Python

外包公司软件测试工程师

2014/11/01 面试题

Python的两道面试题

2013/06/29 面试题

党员对照检查材料思想汇报

2014/09/16 职场文书

工伤事故赔偿协议书（标准）

2014/09/29 职场文书

生日答谢词

2015/01/05 职场文书

督导岗位职责

2015/02/04 职场文书

2015年人民调解工作总结

2015/05/18 职场文书

《水上飞机》教学反思

2016/02/20 职场文书

css3 利用transform-origin 实现圆点分布在大圆上布局及旋转特效

2021/04/29 HTML / CSS

新手入门Mysql--概念

2021/06/18 MySQL

python可视化分析绘制带趋势线的散点图和边缘直方图

2022/06/25 Python