编程 Python

Python3爬虫之urllib携带cookie爬取网页的方法

Posted in Python onDecember 28, 2018

如下所示：

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

- Author -

haeasringnar

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

scrapy自定义pipeline类实现将采集数据保存到mongodb的方法

Apr 16 Python

给Python入门者的一些编程建议

Jun 15 Python

Django框架中方法的访问和查找

Jul 15 Python

深入理解Python中range和xrange的区别

Nov 26 Python

在python中只选取列表中某一纵列的方法

Nov 28 Python

python得到一个excel的全部sheet标签值方法

Dec 10 Python

django模板加载静态文件的方法步骤

Mar 01 Python

Python实现打印实心和空心菱形

Nov 23 Python

pytorch的batch normalize使用详解

Jan 15 Python

python MultipartEncoder传输zip文件实例

Apr 07 Python

Python库skimage绘制二值图像代码实例

Apr 10 Python

python3让print输出不换行的方法

Aug 24 Python

Python编程图形库之Pillow使用方法讲解

Dec 28 #Python

对python中大文件的导入与导出方法详解

Dec 28 #Python

Python编程深度学习计算库之numpy

Dec 28 #Python

python将txt文档每行内容循环插入数据库的方法

Dec 28 #Python

pandas 把数据写入txt文件每行固定写入一定数量的值方法

Dec 28 #Python

Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算

Dec 28 #Python

Python编程深度学习绘图库之matplotlib

Dec 28 #Python

You might like

点评山进PR-D3L三波段收音机

2021/03/02 无线电

PHP的面向对象编程

2006/10/09 PHP

PHPShop存在多个安全漏洞

2006/10/09 PHP

php日历[测试通过]

2008/03/27 PHP

PHP连接SQLServer2005 的问题解决方法

2010/07/19 PHP

php实现分页显示

2015/11/03 PHP

thinkPHP框架实现类似java过滤器的简单方法示例

2018/09/05 PHP

Linux下源码包安装Swoole及基本使用操作图文详解

2019/04/02 PHP

如何将网页表格内容导入excel

2014/02/18 Javascript

nodejs中使用多线程编程的方法实例

2015/03/24 NodeJs

举例简介AngularJS的内部语言环境

2015/06/17 Javascript

javascript字符串函数汇总

2015/12/06 Javascript

JavaScript Date 知识浅析

2017/01/29 Javascript

Vue列表页渲染优化详解

2017/07/24 Javascript

Angular数据绑定机制原理

2018/04/17 Javascript

利用Django框架中select_related和prefetch_related函数对数据库查询优化

2015/04/01 Python

Python实现单词拼写检查

2015/04/25 Python

python出现"IndentationError: unexpected indent"错误解决办法

2017/10/15 Python

python3+PyQt5使用数据库窗口视图

2018/04/24 Python

Python3实现的简单三级菜单功能示例

2019/03/12 Python

Python闭包和装饰器用法实例详解

2019/05/22 Python

Python数据分析模块pandas用法详解

2019/09/04 Python

pytorch 图像中的数据预处理和批标准化实例

2020/01/15 Python

Anaconda和ipython环境适配的实现

2020/04/22 Python

Python 操作SQLite数据库的示例

2020/10/16 Python

用python查找统一局域网下ip对应的mac地址

2021/01/13 Python

世界上最好的足球商店：Unisport

2019/03/02 全球购物

初中三年毕业生的自我评价分享

2014/02/14 职场文书

技能竞赛活动方案

2014/02/21 职场文书

三八节标语

2014/06/27 职场文书

临时租车协议范本

2014/09/23 职场文书

2014年最新领导班子整改方案

2014/09/27 职场文书

2014年护士个人工作总结

2014/11/11 职场文书

导游词范文之颐和园/重庆/云台山

2019/09/10 职场文书

「SHOW BY ROCK!!」“雫シークレットマインド”组合单曲MV公开

2022/03/21 日漫

JS精髓原型链继承及构造函数继承问题纠正

2022/06/16 Javascript