Python3爬虫之urllib携带cookie爬取网页的方法


Posted in Python onDecember 28, 2018

如下所示:

import urllib.request
import urllib.parse
 
url = 'https://weibo.cn/5273088553/info'
#正常的方式进行访问
# headers = {
#  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36'
# }
# 携带cookie进行访问
headers = {
'GET https':'//weibo.cn/5273088553/info HTTP/1.1',
'Host':' weibo.cn',
'Connection':' keep-alive',
'Upgrade-Insecure-Requests':' 1',
'User-Agent':' Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',
'Accept':' text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
# 'Referer: https':'//weibo.cn/',
'Accept-Language':' zh-CN,zh;q=0.9',
'Cookie':' _T_WM=c1913301844388de10cba9d0bb7bbf1e; SUB=_2A253Wy_dDeRhGeNM7FER-CbJzj-IHXVUp7GVrDV6PUJbkdANLXPdkW1NSesPJZ6v1GA5MyW2HEUb9ytQW3NYy19U; SUHB=0bt8SpepeGz439; SCF=Aua-HpSw5-z78-02NmUv8CTwXZCMN4XJ91qYSHkDXH4W9W0fCBpEI6Hy5E6vObeDqTXtfqobcD2D32r0O_5jSRk.; SSOLoginState=1516199821',
}
request = urllib.request.Request(url=url,headers=headers)
response = urllib.request.urlopen(request)
#输出所有
# print(response.read().decode('gbk'))
#将内容写入文件中
with open('weibo.html','wb') as fp:
 fp.write(response.read())

以上这篇Python3爬虫之urllib携带cookie爬取网页的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在python的类中动态添加属性与生成对象
Sep 17 Python
通过Python实现自动填写调查问卷
Sep 06 Python
windows下安装python的C扩展编译环境(解决Unable to find vcvarsall.bat)
Feb 21 Python
Python生成任意范围任意精度的随机数方法
Apr 09 Python
Python实现读写INI配置文件的方法示例
Jun 09 Python
python3中函数参数的四种简单用法
Jul 09 Python
tensorflow 用矩阵运算替换for循环 用tf.tile而不写for的方法
Jul 27 Python
python调用百度语音识别api
Aug 30 Python
Django model 中设置联合约束和联合索引的方法
Aug 06 Python
Python高级编程之继承问题详解(super与mro)
Nov 19 Python
python GUI库图形界面开发之PyQt5中QMainWindow, QWidget以及QDialog的区别和选择
Feb 26 Python
浅谈Python中range与Numpy中arange的比较
Mar 11 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 #Python
对python中大文件的导入与导出方法详解
Dec 28 #Python
Python编程深度学习计算库之numpy
Dec 28 #Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 #Python
pandas 把数据写入txt文件每行固定写入一定数量的值方法
Dec 28 #Python
Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算
Dec 28 #Python
Python编程深度学习绘图库之matplotlib
Dec 28 #Python
You might like
深入file_get_contents与curl函数的详解
2013/06/25 PHP
php调用c接口无错版介绍
2014/03/11 PHP
Yii框架获取当前controlle和action对应id的方法
2014/12/03 PHP
使用PHP进行微信公众平台开发的示例
2015/08/21 PHP
PHP设计模式之装饰器模式定义与用法详解
2018/04/02 PHP
JAVASCRIPT 对象的创建与使用
2021/03/09 Javascript
jquery api参考 visualjquery 中国线路 速度快
2007/11/30 Javascript
javascript 检测浏览器类型和版本的代码
2009/09/15 Javascript
jQuery 源码分析笔记(6) jQuery.data
2011/06/08 Javascript
基于mootools插件实现遮罩层新手引导
2012/05/24 Javascript
javascript 获取元素样式必杀技
2014/05/04 Javascript
抛弃Nginx使用nodejs做反向代理服务器
2014/07/17 NodeJs
深入理解jQuery中的事件冒泡
2016/05/24 Javascript
第三篇Bootstrap网格基础
2016/06/21 Javascript
全面了解javascript中的错误处理机制
2016/07/18 Javascript
js 调用百度分享功能
2017/02/27 Javascript
vue router学习之动态路由和嵌套路由详解
2017/09/21 Javascript
微信小程序之自定义组件的实现代码(附源码)
2018/08/02 Javascript
Vue加载json文件的方法简单示例
2019/01/28 Javascript
世界上最短的数字判断js代码
2019/09/09 Javascript
es6中Promise 对象基本功能与用法实例分析
2020/02/23 Javascript
Python使用Flask框架同时上传多个文件的方法
2015/03/21 Python
python矩阵的转置和逆转实例
2018/12/12 Python
python Django框架实现web端分页呈现数据
2019/10/31 Python
Python csv文件的读写操作实例详解
2019/11/19 Python
将python包发布到PyPI和制作whl文件方式
2019/12/25 Python
python多线程使用方法实例详解
2019/12/30 Python
在 Pycharm 安装使用black的方法详解
2020/04/02 Python
如何清空python的变量
2020/07/05 Python
Python实现手绘图效果实例分享
2020/07/22 Python
如何在Win10系统使用Python3连接Hive
2020/10/15 Python
新加坡网上化妆品店:Best Buy World
2018/05/18 全球购物
财务部岗位职责范本
2015/04/14 职场文书
2019下半年英语教师的教学工作计划(3篇)
2019/09/25 职场文书
MySQL 分页查询的优化技巧
2021/05/12 MySQL
springboot 多数据源配置不生效遇到的坑及解决
2021/11/17 Java/Android