python爬虫添加请求头代码实例


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

request

import requests


headers = {
  # 'Accept': 'application/json, text/javascript, */*; q=0.01',
  # 'Accept': '*/*',
  # 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-US;q=0.7',
  # 'Cache-Control': 'no-cache',
  # 'accept-encoding': 'gzip, deflate, br',
  'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36',
  'Referer': 'https://www.google.com/'
}

resp = requests.get('http://httpbin.org/get', headers=headers)
print(resp.content)

urllib

import urllib, urllib2
def get_page_source(url):
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  req = urllib2.Request(url, None, headers)
  response = urllib2.urlopen(req)
  page_source = response.read()
  return page_source

phantomjs请求页面

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
def get_headers_driver():
  desire = DesiredCapabilities.PHANTOMJS.copy()
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  for key, value in headers.iteritems():
    desire['phantomjs.page.customHeaders.{}'.format(key)] = value
  driver = webdriver.PhantomJS(desired_capabilities=desire, service_args=['--load-images=yes'])#将yes改成no可以让浏览器不加载图片
  return driver

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python模拟登录百度贴吧(百度贴吧登录)实例
Dec 18 Python
Python 中 Meta Classes详解
Feb 13 Python
python实现微信发送邮件关闭电脑功能
Feb 22 Python
python读取文本绘制动态速度曲线
Jun 21 Python
Python3实现计算两个数组的交集算法示例
Apr 03 Python
Django之路由层的实现
Sep 09 Python
Pytorch中accuracy和loss的计算知识点总结
Sep 10 Python
基于python判断目录或者文件代码实例
Nov 29 Python
PyQt5实现简单的计算器
May 30 Python
解决Keras 中加入lambda层无法正常载入模型问题
Jun 16 Python
pyspark对Mysql数据库进行读写的实现
Dec 30 Python
有趣的二维码:使用MyQR和qrcode来制作二维码
May 10 Python
python使用rsa非对称加密过程解析
Dec 28 #Python
Python遍历字典方式就实例详解
Dec 28 #Python
python基于opencv检测程序运行效率
Dec 28 #Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 #Python
Pytorch 多维数组运算过程的索引处理方式
Dec 27 #Python
Pytorch 之修改Tensor部分值方式
Dec 27 #Python
pytorch 实现tensor与numpy数组转换
Dec 27 #Python
You might like
PHP对象转换为数组函数(递归方法)
2012/02/04 PHP
ThinkPHP中I(),U(),$this->post()等函数用法
2014/11/22 PHP
Django 中 cookie的使用
2017/08/17 PHP
常用js脚本
2006/12/03 Javascript
从JavaScript 到 JQuery (1)学习小结
2009/02/12 Javascript
jQuery 页面 Mask实现代码
2010/01/09 Javascript
javascript 拖放效果实现代码
2010/01/22 Javascript
自定义一个jquery插件[鼠标悬浮时候 出现说明label]
2011/06/27 Javascript
jquery Mobile入门—外部链接切换示例代码
2013/01/08 Javascript
JS函数this的用法实例分析
2015/02/05 Javascript
JavaScript设计模式开发中组合模式的使用教程
2016/05/18 Javascript
打造自己的jQuery插件入门教程
2016/09/23 Javascript
js实现3d悬浮效果
2017/02/16 Javascript
bootstrap模态框远程示例代码分享
2017/05/22 Javascript
vue.js删除列表中的一行
2018/06/30 Javascript
详解vue+webpack+express中间件接口使用
2018/07/17 Javascript
vue升级之路之vue-router的使用教程
2018/08/14 Javascript
JS实现数组删除指定元素功能示例
2019/06/05 Javascript
django简单的前后端分离的数据传输实例 axios
2020/05/18 Javascript
编写v-for循环的技巧汇总
2020/12/01 Javascript
python实现list由于numpy array的转换
2018/04/04 Python
关于python写入文件自动换行的问题
2018/06/23 Python
python 列表降维的实例讲解
2018/06/28 Python
对Python3中bytes和HexStr之间的转换详解
2018/12/04 Python
python用for循环求和的方法总结
2019/07/08 Python
pandas的to_datetime时间转换使用及学习心得
2019/08/11 Python
浅析python中while循环和for循环
2019/11/19 Python
python图形开发GUI库pyqt5的基本使用方法详解
2020/02/14 Python
python3 deque 双向队列创建与使用方法分析
2020/03/24 Python
浅谈keras中的batch_dot,dot方法和TensorFlow的matmul
2020/06/18 Python
纯CSS3实现给头像加个光芒四射且旋转的背景动画效果
2014/05/07 HTML / CSS
HTML5 Blob 实现文件下载功能的示例代码
2019/11/29 HTML / CSS
Kate Spade美国官网:纽约新兴时尚品牌,以包包闻名于世
2017/11/09 全球购物
家长学校培训材料
2014/08/20 职场文书
2015元旦晚会主持人开场白+结束语
2014/12/14 职场文书
宝塔更新Python及Flask项目的部署
2022/04/11 Python