Python3爬虫之urllib携带cookie爬取网页的方法


Posted in Python onDecember 28, 2018

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python和Java进行DES加密和解密的实例
Jan 09 Python
Python程序员面试题 你必须提前准备!(答案及解析)
Jan 23 Python
Jupyter安装nbextensions,启动提示没有nbextensions库
Apr 23 Python
Python用于学习重要算法的模块pygorithm实例浅析
Aug 16 Python
python中yield的用法详解——最简单,最清晰的解释
Apr 04 Python
python pandas获取csv指定行 列的操作方法
Jul 12 Python
利用pandas合并多个excel的方法示例
Oct 10 Python
使用 tf.nn.dynamic_rnn 展开时间维度方式
Jan 21 Python
Python Web项目Cherrypy使用方法镜像
Nov 05 Python
详解Django中 render() 函数的使用方法
Apr 22 Python
只用40行Python代码就能写出pdf转word小工具
May 31 Python
5道关于python基础 while循环练习题
Nov 27 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 #Python
对python中大文件的导入与导出方法详解
Dec 28 #Python
Python编程深度学习计算库之numpy
Dec 28 #Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 #Python
pandas 把数据写入txt文件每行固定写入一定数量的值方法
Dec 28 #Python
Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算
Dec 28 #Python
Python编程深度学习绘图库之matplotlib
Dec 28 #Python
You might like
无法在发生错误时创建会话,请检查 PHP 或网站服务器日志,并正确配置 PHP 安装最快的解决办法
2010/08/01 PHP
typecho插件编写教程(一):Hello World
2015/05/28 PHP
PHP实现linux命令tail -f
2016/02/22 PHP
在第一个input框内输入内容.textarea自动得到第一个文件框的值的javascript代码
2007/04/20 Javascript
用CSS+JS实现的进度条效果效果
2007/06/05 Javascript
Lazy Load 延迟加载图片的jQuery插件中文使用文档
2012/10/18 Javascript
javascript学习(一)构建自己的JS库
2013/01/02 Javascript
jquery ajax 局部无刷新更新数据的实现案例
2014/02/08 Javascript
node.js中的fs.read方法使用说明
2014/12/17 Javascript
JavaScript调用客户端Java程序的方法
2015/07/27 Javascript
jquery读写cookie操作实例分析
2015/12/24 Javascript
layui文件上传实现代码
2017/05/20 Javascript
JS使用iView的Dropdown实现一个右键菜单
2019/05/06 Javascript
JavaScript命令模式原理与用法实例详解
2020/03/10 Javascript
[52:22]EG vs VG Supermajor小组赛B组 BO3 第一场 6.2
2018/06/03 DOTA
用Eclipse写python程序
2018/02/10 Python
numpy中的高维数组转置实例
2018/04/17 Python
python实现给微信指定好友定时发送消息
2019/04/29 Python
在pytorch中对非叶节点的变量计算梯度实例
2020/01/10 Python
Python 自由定制表格的实现示例
2020/03/20 Python
python实现一次性封装多条sql语句(begin end)
2020/06/06 Python
python实现scrapy爬虫每天定时抓取数据的示例代码
2021/01/27 Python
Html5应用程序缓存(Cache manifest)
2018/06/04 HTML / CSS
李宁官方网店:中国运动品牌
2017/11/02 全球购物
SmartBuyGlasses意大利:购买太阳镜、眼镜和隐形眼镜
2018/11/20 全球购物
《童趣》教学反思
2014/02/19 职场文书
人力资源部经理的岗位职责
2014/03/04 职场文书
跑操口号
2014/06/12 职场文书
简单租房协议书
2014/10/21 职场文书
工会2014法制宣传日活动总结
2014/11/01 职场文书
2015年干部教育培训工作总结
2015/05/15 职场文书
2016年情人节广告语
2016/01/28 职场文书
2019年警察入党转正申请书最新范文
2019/09/03 职场文书
Golang 空map和未初始化map的注意事项说明
2021/04/29 Golang
日元符号 ¥
2022/02/17 杂记
JavaScript原型链中函数和对象的理解
2022/06/16 Javascript