Python3爬虫之urllib携带cookie爬取网页的方法


Posted in Python onDecember 28, 2018

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python基础教程之循环介绍
Aug 29 Python
使用Python实现BT种子和磁力链接的相互转换
Nov 09 Python
Go/Python/Erlang编程语言对比分析及示例代码
Apr 23 Python
Django中使用Celery的教程详解
Aug 24 Python
python+splinter实现12306网站刷票并自动购票流程
Sep 25 Python
python得到一个excel的全部sheet标签值方法
Dec 10 Python
PyQt5连接MySQL及QMYSQL driver not loaded错误解决
Apr 29 Python
win10下python3.8的PIL库安装过程
Jun 08 Python
详解Python多线程下的list
Jul 03 Python
Python通过getattr函数获取对象的属性值
Oct 16 Python
python数据库批量插入数据的实现(executemany的使用)
Apr 30 Python
Python机器学习之基于Pytorch实现猫狗分类
Jun 08 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 #Python
对python中大文件的导入与导出方法详解
Dec 28 #Python
Python编程深度学习计算库之numpy
Dec 28 #Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 #Python
pandas 把数据写入txt文件每行固定写入一定数量的值方法
Dec 28 #Python
Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算
Dec 28 #Python
Python编程深度学习绘图库之matplotlib
Dec 28 #Python
You might like
php登陆页的密码处理方式分享
2013/10/14 PHP
PHP5多态性与动态绑定介绍
2015/04/03 PHP
php生成二维码
2015/08/10 PHP
php防止CC攻击代码 php防止网页频繁刷新
2015/12/21 PHP
Zend Framework基于Command命令行建立ZF项目的方法
2017/02/18 PHP
在你的网页中嵌入外部网页的方法
2007/04/02 Javascript
JS支持带x身份证号码验证函数
2008/08/10 Javascript
Javascript中Eval函数的使用
2010/03/23 Javascript
js返回前一页刷新本页重载页面
2014/07/29 Javascript
jQuery中not()方法用法实例
2015/01/06 Javascript
关于获取DIV内部内容报错的原因分析及解决办法
2016/01/29 Javascript
nodejs 的 session 简单使用
2016/06/06 NodeJs
解决前端跨域问题方案汇总
2016/11/20 Javascript
完美解决IE不支持Data.parse()的问题
2016/11/24 Javascript
Vuex之理解state的用法实例
2017/04/19 Javascript
微信小程序switch开关选择器使用详解
2018/01/31 Javascript
python网络编程之UDP通信实例(含服务器端、客户端、UDP广播例子)
2014/04/25 Python
使用Python操作MySQL的一些基本方法
2015/08/16 Python
Django使用详解:ORM 的反向查找(related_name)
2018/05/30 Python
tensorflow实现加载mnist数据集
2018/09/08 Python
Python中的元组介绍
2019/01/28 Python
ActiveMQ:使用Python访问ActiveMQ的方法
2019/01/30 Python
Python 学习教程之networkx
2019/04/15 Python
python super用法及原理详解
2020/01/20 Python
使用TensorBoard进行超参数优化的实现
2020/07/06 Python
荷兰包包购物网站:The Little Green Bag
2018/03/17 全球购物
受希腊女神灵感的晚礼服、鸡尾酒礼服和婚纱:THEIA
2018/04/15 全球购物
J2EE面试题集锦(附答案)
2013/08/16 面试题
自荐信格式范文
2013/10/07 职场文书
粗加工管理制度
2014/02/04 职场文书
大学毕业感言50字
2014/02/07 职场文书
小学生学习雷锋倡议书
2014/05/15 职场文书
岗位安全生产责任书
2014/07/28 职场文书
个人股份转让协议书范本
2015/01/28 职场文书
培训通知书模板
2015/04/17 职场文书
2019最新版火锅店的创业计划书 !
2019/07/12 职场文书