python爬虫添加请求头代码实例


Posted in Python onDecember 28, 2019

这篇文章主要介绍了python爬虫添加请求头代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

request

import requests


headers = {
  # 'Accept': 'application/json, text/javascript, */*; q=0.01',
  # 'Accept': '*/*',
  # 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-US;q=0.7',
  # 'Cache-Control': 'no-cache',
  # 'accept-encoding': 'gzip, deflate, br',
  'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.97 Safari/537.36',
  'Referer': 'https://www.google.com/'
}

resp = requests.get('http://httpbin.org/get', headers=headers)
print(resp.content)

urllib

import urllib, urllib2
def get_page_source(url):
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  req = urllib2.Request(url, None, headers)
  response = urllib2.urlopen(req)
  page_source = response.read()
  return page_source

phantomjs请求页面

from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
def get_headers_driver():
  desire = DesiredCapabilities.PHANTOMJS.copy()
  headers = {'Accept': '*/*',
        'Accept-Language': 'en-US,en;q=0.8',
        'Cache-Control': 'max-age=0',
        'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36',
        'Connection': 'keep-alive',
        'Referer': 'http://www.baidu.com/'
        }
  for key, value in headers.iteritems():
    desire['phantomjs.page.customHeaders.{}'.format(key)] = value
  driver = webdriver.PhantomJS(desired_capabilities=desire, service_args=['--load-images=yes'])#将yes改成no可以让浏览器不加载图片
  return driver

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python3字符串学习教程
Aug 20 Python
用python写的一个wordpress的采集程序
Feb 27 Python
浅谈Python使用Bottle来提供一个简单的web服务
Dec 27 Python
pandas DataFrame实现几列数据合并成为新的一列方法
Jun 08 Python
Django+JS 实现点击头像即可更改头像的方法示例
Dec 26 Python
简单了解python单例模式的几种写法
Jul 01 Python
Python学习笔记之文件的读写操作实例分析
Aug 07 Python
python匿名函数的使用方法解析
Oct 10 Python
python保存log日志,实现用log日志画图
Dec 24 Python
Django 拼接两个queryset 或是两个不可以相加的对象实例
Mar 28 Python
150行Python代码实现带界面的数独游戏
Apr 04 Python
python海龟绘图之画国旗实例代码
Nov 11 Python
python使用rsa非对称加密过程解析
Dec 28 #Python
Python遍历字典方式就实例详解
Dec 28 #Python
python基于opencv检测程序运行效率
Dec 28 #Python
把vgg-face.mat权重迁移到pytorch模型示例
Dec 27 #Python
Pytorch 多维数组运算过程的索引处理方式
Dec 27 #Python
Pytorch 之修改Tensor部分值方式
Dec 27 #Python
pytorch 实现tensor与numpy数组转换
Dec 27 #Python
You might like
图书管理程序(二)
2006/10/09 PHP
别人整理的服务器变量:$_SERVER
2006/10/20 PHP
在wamp集成环境下升级php版本(实现方法)
2013/07/01 PHP
百度地图API应用之获取用户的具体位置
2014/06/10 PHP
php中使用gd库实现远程图片下载实例
2015/05/12 PHP
Apache服务器下防止图片盗链的办法
2015/07/06 PHP
PHP获取用户访问IP地址的5种方法
2016/05/16 PHP
通过身份证号得到出生日期和性别的js代码
2009/11/23 Javascript
javascript下判断一个元素是否存在的代码
2010/03/05 Javascript
JSON 教程 json入门学习笔记
2020/09/22 Javascript
Javascript模块化编程(一)AMD规范(规范使用模块)
2013/01/17 Javascript
js处理表格对table进行修饰
2014/05/26 Javascript
Javascript中String的常用方法实例分析
2015/06/13 Javascript
js判断手机端(Android手机还是iPhone手机)
2015/07/22 Javascript
JavaScript实现标题栏文字轮播效果代码
2015/10/24 Javascript
JavaScript观察者模式(经典)
2015/12/09 Javascript
js创建数组的简单方法
2016/07/27 Javascript
JS 获取HTML标签内的子节点的方法
2016/09/21 Javascript
AngularJS出现$http异步后台无法获取请求参数问题的解决方法
2016/11/03 Javascript
JavaScript设计模式之原型模式分析【ES5与ES6】
2018/07/26 Javascript
通过js实现压缩图片上传功能
2020/02/25 Javascript
[51:30]OG vs LGD 2018国际邀请赛淘汰赛BO3 第二场 8.26
2018/08/30 DOTA
Python 爬虫爬取指定博客的所有文章
2016/02/17 Python
Python2包含中文报错的解决方法
2018/07/09 Python
python 对key为时间的dict排序方法
2018/10/17 Python
解决vscode python print 输出窗口中文乱码的问题
2018/12/03 Python
Python类的继承用法示例
2019/01/31 Python
python调用摄像头的示例代码
2020/09/28 Python
python实现scrapy爬虫每天定时抓取数据的示例代码
2021/01/27 Python
基于HTML5的WebGL经典3D虚拟机房漫游动画
2017/11/15 HTML / CSS
幼儿园秋游活动方案
2014/01/21 职场文书
教师三严三实学习心得体会
2014/10/11 职场文书
2015年事业单位办公室文员工作总结
2015/04/24 职场文书
法定授权委托证明书
2015/06/18 职场文书
使用python将HTML转换为PDF pdfkit包(wkhtmltopdf) 的使用方法
2022/04/21 Python
Spring JPA 增加字段执行异常问题及解决
2022/06/10 Java/Android