Python3爬虫之urllib携带cookie爬取网页的方法


Posted in Python onDecember 28, 2018

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中多线程thread与threading的实现方法
Aug 18 Python
Python正则表达式常用函数总结
Jun 24 Python
Python简单计算文件MD5值的方法示例
Apr 11 Python
解决pycharm 误删掉项目文件的处理方法
Oct 22 Python
python从子线程中获得返回值的方法
Jan 30 Python
python中数组和矩阵乘法及使用总结(推荐)
May 18 Python
Python enumerate函数遍历数据对象组合过程解析
Dec 11 Python
Python获取二维数组的行列数的2种方法
Feb 11 Python
tensorflow保持每次训练结果一致的简单实现
Feb 17 Python
Python+Opencv身份证号码区域提取及识别实现
Aug 25 Python
Python如何使用ConfigParser读取配置文件
Nov 12 Python
python基于scrapy爬取京东笔记本电脑数据并进行简单处理和分析
Apr 14 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 #Python
对python中大文件的导入与导出方法详解
Dec 28 #Python
Python编程深度学习计算库之numpy
Dec 28 #Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 #Python
pandas 把数据写入txt文件每行固定写入一定数量的值方法
Dec 28 #Python
Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算
Dec 28 #Python
Python编程深度学习绘图库之matplotlib
Dec 28 #Python
You might like
PHP脚本的10个技巧(3)
2006/10/09 PHP
深入理解ob_flush和flush的区别(ob_flush()与flush()使用方法)
2013/02/06 PHP
PHP两种快速排序算法实例
2015/02/15 PHP
实例讲解PHP表单处理
2019/02/15 PHP
用最通俗易懂的代码帮助新手理解javascript闭包 推荐
2012/03/01 Javascript
利用javascript判断文件是否存在
2013/12/31 Javascript
网页中表单按回车就自动提交的问题的解决方案
2014/11/03 Javascript
用队列模拟jquery的动画算法实例
2015/01/20 Javascript
jQuery实现简单的DIV拖动效果
2016/02/19 Javascript
jquery实现列表上下移动功能
2016/02/25 Javascript
Javascript 实现放大镜效果实例详解
2016/12/03 Javascript
Angularjs验证用户输入的字符串是否为日期时间
2017/06/01 Javascript
最全的JavaScript开发工具列表 总有一款适合你
2017/06/29 Javascript
vue+node+webpack环境搭建教程
2017/11/05 Javascript
vue-baidu-map 进入页面自动定位的解决方案(推荐)
2018/04/28 Javascript
node.js实现简单的压缩/解压缩功能示例
2019/11/05 Javascript
uniapp与webview之间的相互传值的实现
2020/06/29 Javascript
如何使用 JavaScript 操作浏览器历史记录 API
2020/11/24 Javascript
go语言计算两个时间的时间差方法
2015/03/13 Python
python删除服务器文件代码示例
2018/02/09 Python
Python装饰器用法示例小结
2018/02/11 Python
Python入门之后再看点什么好?
2018/03/05 Python
Django CSRF跨站请求伪造防护过程解析
2019/07/31 Python
CSS3实现多背景模拟动态边框的效果
2016/11/08 HTML / CSS
html5文本内容_动力节点Java学院整理
2017/07/11 HTML / CSS
英国最大的电脑零售连锁店集团:PC World
2016/10/10 全球购物
英国皇家邮政海外旗舰店:Royal Mail
2018/02/21 全球购物
Vans(范斯)新西兰官方网站:美国原创极限运动品牌
2020/09/19 全球购物
留学推荐信中文范文三篇
2014/01/25 职场文书
《海底世界》教学反思
2014/04/16 职场文书
2014年银行员工年终自我评价
2014/09/19 职场文书
2014年最新版离婚协议书范本
2014/11/25 职场文书
歼十出击观后感
2015/06/11 职场文书
新郎父母婚礼答谢词
2015/09/29 职场文书
25句企业管理语录:助你迅速打开思路,句句经典!
2020/01/14 职场文书
Redis如何使用乐观锁(CAS)保证数据一致性
2022/03/25 Redis