Python3爬虫之urllib携带cookie爬取网页的方法


Posted in Python onDecember 28, 2018

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
scrapy自定义pipeline类实现将采集数据保存到mongodb的方法
Apr 16 Python
给Python入门者的一些编程建议
Jun 15 Python
Django框架中方法的访问和查找
Jul 15 Python
深入理解Python中range和xrange的区别
Nov 26 Python
在python中只选取列表中某一纵列的方法
Nov 28 Python
python得到一个excel的全部sheet标签值方法
Dec 10 Python
django模板加载静态文件的方法步骤
Mar 01 Python
Python实现打印实心和空心菱形
Nov 23 Python
pytorch的batch normalize使用详解
Jan 15 Python
python MultipartEncoder传输zip文件实例
Apr 07 Python
Python库skimage绘制二值图像代码实例
Apr 10 Python
python3让print输出不换行的方法
Aug 24 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 #Python
对python中大文件的导入与导出方法详解
Dec 28 #Python
Python编程深度学习计算库之numpy
Dec 28 #Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 #Python
pandas 把数据写入txt文件每行固定写入一定数量的值方法
Dec 28 #Python
Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算
Dec 28 #Python
Python编程深度学习绘图库之matplotlib
Dec 28 #Python
You might like
点评山进PR-D3L三波段收音机
2021/03/02 无线电
PHP的面向对象编程
2006/10/09 PHP
PHPShop存在多个安全漏洞
2006/10/09 PHP
php日历[测试通过]
2008/03/27 PHP
PHP连接SQLServer2005 的问题解决方法
2010/07/19 PHP
php实现分页显示
2015/11/03 PHP
thinkPHP框架实现类似java过滤器的简单方法示例
2018/09/05 PHP
Linux下源码包安装Swoole及基本使用操作图文详解
2019/04/02 PHP
如何将网页表格内容导入excel
2014/02/18 Javascript
nodejs中使用多线程编程的方法实例
2015/03/24 NodeJs
举例简介AngularJS的内部语言环境
2015/06/17 Javascript
javascript字符串函数汇总
2015/12/06 Javascript
JavaScript Date 知识浅析
2017/01/29 Javascript
Vue列表页渲染优化详解
2017/07/24 Javascript
Angular数据绑定机制原理
2018/04/17 Javascript
利用Django框架中select_related和prefetch_related函数对数据库查询优化
2015/04/01 Python
Python实现单词拼写检查
2015/04/25 Python
python出现"IndentationError: unexpected indent"错误解决办法
2017/10/15 Python
python3+PyQt5使用数据库窗口视图
2018/04/24 Python
Python3实现的简单三级菜单功能示例
2019/03/12 Python
Python闭包和装饰器用法实例详解
2019/05/22 Python
Python数据分析模块pandas用法详解
2019/09/04 Python
pytorch 图像中的数据预处理和批标准化实例
2020/01/15 Python
Anaconda和ipython环境适配的实现
2020/04/22 Python
Python 操作SQLite数据库的示例
2020/10/16 Python
用python查找统一局域网下ip对应的mac地址
2021/01/13 Python
世界上最好的足球商店:Unisport
2019/03/02 全球购物
初中三年毕业生的自我评价分享
2014/02/14 职场文书
技能竞赛活动方案
2014/02/21 职场文书
三八节标语
2014/06/27 职场文书
临时租车协议范本
2014/09/23 职场文书
2014年最新领导班子整改方案
2014/09/27 职场文书
2014年护士个人工作总结
2014/11/11 职场文书
导游词范文之颐和园/重庆/云台山
2019/09/10 职场文书
「SHOW BY ROCK!!」“雫シークレットマインド”组合单曲MV公开
2022/03/21 日漫
JS精髓原型链继承及构造函数继承问题纠正
2022/06/16 Javascript