python爬虫中get和post方法介绍以及cookie作用


Posted in Python onFebruary 08, 2018

首先确定你要爬取的目标网站的表单提交方式,可以通过开发者工具看到。这里推荐使用chrome。

这里我用163邮箱为例

打开工具后再Network中,在Name选中想要了解的网站,右侧headers里的request method就是提交方式。status如果是200表示成功访问下面的有头信息,cookie是你登录之后产生的存储会话(session)信息的。第一次访问该网页需要提供用户名和密码,之后只需要在headers里提供cookie就可以登陆进去。

引入requests库,会提供get和post的方法。

代码示例:

import requests
import ssl

user_agent="Mozilla/5.0 (Windows NT 10.0; WOW64; rv:50.0) Gecko/20100101 Firefox/50.0"
accept='text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8'
accept_language='zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3'
upgrade='1'
headers={
  'User-Agent':user_agent,
  'Accept':accept,
  'Accept-Language':accept_language,
'Cookie':'....'#这里填入你登陆后产生的cookie
}
r = requests.get("http://mail.163.com/js6/main.jsp?sid=OAwUtGgglzEJoANLHPggrsKKAhsyheAT&df=mail163_letter#module=welcome.WelcomeModule%7C%7B%7D",headers=headers,verify=False)
fp = open("/temp/csdn.txt","w",encoding='utf-8')
fp.write(str(r.content,'utf-8'))
fp.close()

这里我引入了ssl库,因为我第一次访问的网页证书过期。如果我们使用爬虫进入这样的网站时,会报错:SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:581)

在requests的get和post方法中,有一个参数为verify,把他设为False后会禁掉证书的要求

Python 相关文章推荐
python中self原理实例分析
Apr 30 Python
python通过apply使用元祖和列表调用函数实例
May 26 Python
Python单链表简单实现代码
Apr 27 Python
举例讲解Python面向对象编程中类的继承
Jun 17 Python
Python排序搜索基本算法之选择排序实例分析
Dec 09 Python
django 按时间范围查询数据库实例代码
Feb 11 Python
Python SQLite3简介
Feb 22 Python
python 产生token及token验证的方法
Dec 26 Python
Python使用pymongo库操作MongoDB数据库的方法实例
Feb 22 Python
Python Matplotlib实现三维数据的散点图绘制
Mar 19 Python
pyqt 实现为长内容添加滑轮 scrollArea
Jun 19 Python
Python基于time模块表示时间常用方法
Jun 18 Python
Python OpenCV 直方图的计算与显示的方法示例
Feb 08 #Python
python OpenCV学习笔记之绘制直方图的方法
Feb 08 #Python
Python列表推导式与生成器表达式用法示例
Feb 08 #Python
详解python OpenCV学习笔记之直方图均衡化
Feb 08 #Python
python OpenCV学习笔记实现二维直方图
Feb 08 #Python
Python数据分析之双色球基于线性回归算法预测下期中奖结果示例
Feb 08 #Python
Python编程argparse入门浅析
Feb 07 #Python
You might like
微信access_token的获取开发示例
2015/04/16 PHP
PHP身份证校验码计算方法
2016/08/10 PHP
javascript 简单高效判断数据类型 系列函数 By shawl.qiu
2007/03/06 Javascript
jQuery 版本的文本输入框检查器Input Check
2009/07/09 Javascript
扩展Jquery插件处理mouseover时内部有子元素时发生样式闪烁
2011/12/08 Javascript
js/ajax跨越访问-jsonp的原理和实例(javascript和jquery实现代码)
2012/12/27 Javascript
jquery div拖动效果示例代码
2013/12/08 Javascript
javascript中typeof操作符和constucor属性检测
2015/02/26 Javascript
浅谈jquery.fn.extend与jquery.extend区别
2015/07/13 Javascript
jQuery入门基础知识学习指南
2015/08/14 Javascript
js只执行1次的函数示例
2016/07/20 Javascript
Javascript 事件冒泡机制详细介绍
2016/10/10 Javascript
详解vue-validator(vue验证器)
2017/01/16 Javascript
通过一次报错详细谈谈Point事件
2018/05/17 Javascript
浅谈React的最大亮点之虚拟DOM
2018/05/29 Javascript
微信小程序使用wx.request请求服务器json数据并渲染到页面操作示例
2019/03/30 Javascript
Python使用百度API上传文件到百度网盘代码分享
2014/11/08 Python
python3 面向对象__类的内置属性与方法的实例代码
2018/11/09 Python
Python 微信爬虫完整实例【单线程与多线程】
2019/07/06 Python
python绘制多个子图的实例
2019/07/07 Python
css3的图形3d翻转效果应用示例
2014/04/08 HTML / CSS
CSS3实现超慢速移动动画效果非常流畅无卡顿
2014/06/15 HTML / CSS
回馈慈善的设计师太阳镜:DIFF eyewear
2019/10/17 全球购物
戛纳奢侈品商店:Jacques Loup法国
2019/11/04 全球购物
JBL加拿大官方商店:扬声器、耳机等
2020/10/23 全球购物
腾讯技术类校园招聘笔试试题
2014/05/06 面试题
linux面试题参考答案(10)
2016/10/26 面试题
《自然之道》教学反思
2014/02/11 职场文书
幼儿园秋游感想
2014/03/12 职场文书
师范生自我鉴定
2014/03/20 职场文书
婚假请假条怎么写
2014/04/10 职场文书
爱牙日宣传活动总结
2015/02/05 职场文书
离婚上诉状范文
2015/05/23 职场文书
浅谈如何写好演讲稿?
2019/06/12 职场文书
教你怎么用python实现字符串转日期
2021/05/24 Python
python中redis包操作数据库的教程
2022/04/19 Python