Python3爬虫之urllib携带cookie爬取网页的方法


Posted in Python onDecember 28, 2018

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python合并文本文件示例
Feb 07 Python
python实现随机密码字典生成器示例
Apr 09 Python
python基础教程之五种数据类型详解
Jan 12 Python
python如何实现int函数的方法示例
Feb 19 Python
Python采集代理ip并判断是否可用和定时更新的方法
May 07 Python
python实现统计文本中单词出现的频率详解
May 20 Python
Python进程间通信Queue消息队列用法分析
May 22 Python
树莓派+摄像头实现对移动物体的检测
Jun 22 Python
对python中GUI,Label和Button的实例详解
Jun 27 Python
利用pyecharts实现地图可视化的例子
Aug 12 Python
python 解决Fatal error in launcher:错误问题
May 21 Python
python tqdm库的使用
Nov 30 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 #Python
对python中大文件的导入与导出方法详解
Dec 28 #Python
Python编程深度学习计算库之numpy
Dec 28 #Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 #Python
pandas 把数据写入txt文件每行固定写入一定数量的值方法
Dec 28 #Python
Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算
Dec 28 #Python
Python编程深度学习绘图库之matplotlib
Dec 28 #Python
You might like
晶体管单管来复再生式收音机
2021/03/02 无线电
德生PL330的评价与改造
2021/03/02 无线电
PHP新手上路(六)
2006/10/09 PHP
php str_pad 函数用法简介
2009/07/11 PHP
php 传值赋值与引用赋值的区别
2010/12/29 PHP
PHP面向对象之旅:深入理解static变量与方法
2014/01/06 PHP
PHP实现采集抓取淘宝网单个商品信息
2015/01/08 PHP
javascript form 验证函数 弹出对话框形式
2009/06/23 Javascript
浅谈JavaScript编程语言的编码规范
2011/10/21 Javascript
js获取视频时长代码
2014/04/10 Javascript
什么是cookie?js手动创建和存储cookie
2014/05/27 Javascript
js自定义回调函数
2015/12/13 Javascript
JavaScript+CSS实现的可折叠二级菜单实例
2016/02/29 Javascript
JS中使用new Date(str)创建时间对象不兼容firefox和ie的解决方法(两种)
2016/12/14 Javascript
Html中 IFrame的用法及注意点
2016/12/22 Javascript
最全vue的vue-amap使用高德地图插件画多边形范围的示例代码
2020/07/17 Javascript
前端使用crypto.js进行加密的函数代码
2020/08/16 Javascript
js实现简单扫雷
2020/11/27 Javascript
[40:04]Secret vs Infamous 2019国际邀请赛淘汰赛 败者组 BO3 第二场 8.23
2019/09/05 DOTA
python删除过期log文件操作实例解析
2018/01/31 Python
python-itchat 统计微信群、好友数量,及原始消息数据的实例
2019/02/21 Python
python实现学员管理系统
2019/02/26 Python
python爬虫爬取网页数据并解析数据
2020/09/18 Python
Vichy薇姿加拿大官网:法国药妆,全球专业敏感肌护肤领先品牌
2018/07/11 全球购物
中级会计职业生涯规划范文
2014/01/16 职场文书
机电专业大学生职业规划书范文
2014/02/25 职场文书
学生个人自我鉴定范文
2014/03/28 职场文书
房产委托公证书
2014/04/08 职场文书
四年级评语大全
2014/04/21 职场文书
竞选体育委员演讲稿
2014/04/26 职场文书
电子商务系毕业生自荐信
2014/05/29 职场文书
幼儿园教师考核评语
2014/12/31 职场文书
党员年终个人总结
2015/02/14 职场文书
六种css3实现的边框过渡效果
2021/04/22 HTML / CSS
基于flask实现五子棋小游戏
2021/05/25 Python
正则表达式拆分url实例代码
2022/02/24 Java/Android