Python3爬虫之urllib携带cookie爬取网页的方法


Posted in Python onDecember 28, 2018

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中endswith()函数的基本使用
Apr 07 Python
Python批量查询域名是否被注册过
Jun 21 Python
Python 中pandas.read_excel详细介绍
Jun 23 Python
Python利用ElementTree模块处理XML的方法详解
Aug 31 Python
python3大文件解压和基本操作
Dec 15 Python
python获取时间及时间格式转换问题实例代码详解
Dec 06 Python
Python字符串的一些操作方法总结
Jun 10 Python
使用Flask-Cache缓存实现给Flask提速的方法详解
Jun 11 Python
详解Python Qt的窗体开发的基本操作
Jul 14 Python
Python使用configparser库读取配置文件
Feb 22 Python
Django中的AutoField字段使用
May 18 Python
python opencv实现直线检测并测出倾斜角度(附源码+注释)
Dec 31 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 #Python
对python中大文件的导入与导出方法详解
Dec 28 #Python
Python编程深度学习计算库之numpy
Dec 28 #Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 #Python
pandas 把数据写入txt文件每行固定写入一定数量的值方法
Dec 28 #Python
Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算
Dec 28 #Python
Python编程深度学习绘图库之matplotlib
Dec 28 #Python
You might like
php修改指定文件后缀的方法
2014/09/11 PHP
PHP实现获取域名的方法小结
2014/11/05 PHP
弹出广告特效(一个IP只弹出一次)的代码
2007/07/27 Javascript
Javascript 设计模式(二) 闭包
2010/05/26 Javascript
浅析document.ready和window.onload的区别讲解
2013/12/18 Javascript
JQuery+Ajax无刷新分页的实例代码
2014/02/08 Javascript
js使用for循环查询数组中是否存在某个值
2014/08/12 Javascript
Node.js中使用计时器定时执行函数详解
2014/08/15 Javascript
jQuery中noConflict()用法实例分析
2015/02/08 Javascript
jQuery移动页面开发中的触摸事件与虚拟鼠标事件简介
2015/12/03 Javascript
bootstrapValidator bootstrap-select验证不可用的解决办法
2017/01/11 Javascript
纯JavaScript实现实时反馈系统时间
2017/10/26 Javascript
Express本地测试HTTPS的示例代码
2018/06/06 Javascript
countup.js实现数字动态叠加效果
2019/10/17 Javascript
vue页面加载时的进度条功能(实例代码)
2020/01/13 Javascript
Python多线程编程(五):死锁的形成
2015/04/05 Python
python获取本机mac地址和ip地址的方法
2015/04/29 Python
Python开发中爬虫使用代理proxy抓取网页的方法示例
2017/09/26 Python
pycharm 在windows上编辑代码用linux执行配置的方法
2018/10/27 Python
Python-copy()与deepcopy()区别详解
2019/07/12 Python
python numpy数组中的复制知识解析
2020/02/03 Python
django 实现手动存储文件到model的FileField
2020/03/30 Python
Python Pivot table透视表使用方法解析
2020/09/11 Python
HTML5 script元素async、defer异步加载使用介绍
2013/08/23 HTML / CSS
联想瑞士官方网站:Lenovo Switzerland
2017/11/19 全球购物
高尔夫球鞋、服装、手套和装备:FootJoy
2018/12/15 全球购物
大唐电信科技股份有限公司java工程师面试经历
2016/12/09 面试题
实习护理工作自我评价
2013/09/25 职场文书
企业消防安全责任书
2014/07/23 职场文书
纪念一二九运动演讲稿
2014/09/16 职场文书
工厂清洁工岗位职责
2015/02/14 职场文书
病人慰问信范文
2015/02/15 职场文书
2015年上半年党建工作总结
2015/03/30 职场文书
机器人瓦力观后感
2015/06/12 职场文书
2016年第16个全民国防教育日宣传活动总结
2016/04/05 职场文书
小程序实现侧滑删除功能
2022/06/25 Javascript