Python3爬虫之urllib携带cookie爬取网页的方法


Posted in Python onDecember 28, 2018

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
简单介绍Python中的JSON使用
Apr 28 Python
Django中处理出错页面的方法
Jul 15 Python
Python下的常用下载安装工具pip的安装方法
Nov 13 Python
python三引号输出方法
Feb 27 Python
Python实现FTP文件传输的实例
Jul 07 Python
django 邮件发送模块smtp使用详解
Jul 22 Python
浅析PEP570新语法: 只接受位置参数
Oct 15 Python
Pytorch实现LSTM和GRU示例
Jan 14 Python
如何在python开发工具PyCharm中搭建QtPy环境(教程详解)
Feb 04 Python
python如何利用paramiko执行服务器命令
Nov 07 Python
如何用python批量调整视频声音
Dec 22 Python
Pycharm制作搞怪弹窗的实现代码
Feb 19 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 #Python
对python中大文件的导入与导出方法详解
Dec 28 #Python
Python编程深度学习计算库之numpy
Dec 28 #Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 #Python
pandas 把数据写入txt文件每行固定写入一定数量的值方法
Dec 28 #Python
Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算
Dec 28 #Python
Python编程深度学习绘图库之matplotlib
Dec 28 #Python
You might like
完美实现GIF动画缩略图的php代码
2011/01/02 PHP
PHP array操作10个小技巧分享
2011/06/23 PHP
php实现网页缓存的工具类分享
2015/07/14 PHP
PHP实现的限制IP投票程序IP来源分析
2016/05/04 PHP
php图片添加水印例子
2016/07/20 PHP
AJAX的跨域与JSONP(为文章自动添加短址的功能)
2010/01/17 Javascript
javascript中字符串拼接需注意的问题
2010/07/13 Javascript
google jQuery 引用文件,jQuery 引用地址集合(jquery 1.2.6至jquery1.5.2)
2011/04/24 Javascript
jquery应该如何来设置改变按钮input的onclick事件
2012/12/10 Javascript
html a标签-超链接中confirm方法使用介绍
2013/01/04 Javascript
javascript自动给文本url地址增加链接的方法分享
2014/01/20 Javascript
jQuery设置与获取HTML,文本和值的简单实例
2014/02/26 Javascript
JavaSript中变量的作用域闭包的深入理解
2014/05/12 Javascript
教你用jquery实现iframe自适应高度
2014/06/11 Javascript
JavaScript插件化开发教程 (三)
2015/01/27 Javascript
Javascript核心读书有感之语句
2015/02/11 Javascript
在Html中使用Requirejs进行模块化开发实例详解
2016/04/15 Javascript
JSON字符串和对象相互转换实例分析
2016/06/16 Javascript
关于javascript原型的修改与重写(覆盖)差别详解
2016/08/31 Javascript
深入解析Python设计模式编程中建造者模式的使用
2016/03/02 Python
python基于twisted框架编写简单聊天室
2018/01/02 Python
python实现验证码识别功能
2018/06/07 Python
python 美化输出信息的实例
2018/10/15 Python
Python3之手动创建迭代器的实例代码
2019/05/22 Python
Python完成哈夫曼树编码过程及原理详解
2019/07/29 Python
python实现文件批量编码转换及注意事项
2019/10/14 Python
Python新手学习raise用法
2020/06/03 Python
西班牙英格列斯百货英国官网:El Corte Inglés英国
2017/10/30 全球购物
数控专业毕业生求职信范文
2013/09/21 职场文书
导购员的岗位职责
2014/02/08 职场文书
土建专业毕业生自荐书
2014/07/04 职场文书
群众路线教育实践活动学习笔记
2014/11/05 职场文书
大学生就业推荐表自我评价
2015/03/02 职场文书
2015年高二班主任工作总结
2015/05/25 职场文书
教师学习十八届五中全会精神心得体会
2016/01/05 职场文书
党员理论学习心得体会
2016/01/21 职场文书