Python requests获取网页常用方法解析


Posted in Python onFebruary 20, 2020

这篇文章主要介绍了Python requests获取网页常用方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

主要记录使用 requests 模块获取网页源码的方法

class Crawler(object):
 """
 采集类
 """
 def __init__(self, base_url):
  self._base_url = base_url
  self._cookie = None
  self._getCookie()

 def _getCookie(self):
  """
  获取站点cookie
  :return:
  """
  try:
   res = requests.get(self._base_url)
   res.raise_for_status()
   # TODO response.cookies获取到的是一个cookiejar对象,需要使用requests.utils.dict_from_cookiejar来
   # TODO 将cookiejar对象转换为一个字典,这个字典后续使用的时候,在请求时直接传入就可以了,
   # 如 requests.get(url, cookies=cookies)
   self._cookie = requests.utils.dict_from_cookiejar(res.cookies)
   print self._cookie
  except Exception as e:
   print e

 def get_html_text(self, url, **kwargs):
  """
  爬取网页的通用代码框架
  :param url:
  :param method:
  :param kwargs:
  :return:
  """
  try:
   kwargs.setdefault('cookies', self._cookie)
   res = requests.get(url, **kwargs)
   # TODO 若响应状态码不是200, 抛出 HTTPError 异常
   res.raise_for_status()
   res.encoding = res.apparent_encoding
   # print requests.utils.dict_from_cookiejar(res.cookies)
   return res.text
  except Exception as e:
   print traceback.print_exc()
   return

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python网络爬虫实例讲解
Apr 28 Python
python 实现红包随机生成算法的简单实例
Jan 04 Python
详解Golang 与python中的字符串反转
Jul 21 Python
python对配置文件.ini进行增删改查操作的方法示例
Jul 28 Python
基于Python中capitalize()与title()的区别详解
Dec 09 Python
代码讲解Python对Windows服务进行监控
Feb 11 Python
python如何在循环引用中管理内存
Mar 20 Python
详解Python3 中hasattr()、getattr()、setattr()、delattr()函数及示例代码数
Apr 18 Python
详解python websocket获取实时数据的几种常见链接方式
Jul 01 Python
PyQt+socket实现远程操作服务器的方法示例
Aug 22 Python
python使用SQLAlchemy操作MySQL
Jan 02 Python
详解anaconda安装步骤
Nov 23 Python
pytorch实现保证每次运行使用的随机数都相同
Feb 20 #Python
Python argparse模块使用方法解析
Feb 20 #Python
浅谈pytorch torch.backends.cudnn设置作用
Feb 20 #Python
Python sqlite3查询操作过程解析
Feb 20 #Python
python利用datetime模块计算程序运行时间问题
Feb 20 #Python
pytorch数据预处理错误的解决
Feb 20 #Python
Python异常继承关系和自定义异常实现代码实例
Feb 20 #Python
You might like
php获取文件夹路径内的图片以及分页显示示例
2014/03/11 PHP
PHP生成自定义长度随机字符串的函数分享
2014/05/04 PHP
JavaScript 输入框内容格式验证代码
2010/02/11 Javascript
JQuery防止退格键网页后退的实现代码
2012/03/23 Javascript
jquery仿京东导航/仿淘宝商城左侧分类导航下拉菜单效果
2013/04/24 Javascript
jquery弹出关闭遮罩层实例
2013/08/06 Javascript
对比分析json及XML
2014/11/28 Javascript
jQuery实现可关闭固定于底(顶)部的工具条菜单效果
2015/11/06 Javascript
分享一道关于闭包、bind和this的面试题
2017/02/20 Javascript
Angular2 Service实现简单音乐播放器服务
2017/02/24 Javascript
JS FormData上传文件的设置方法
2017/07/05 Javascript
详解Angular4 路由设置相关
2017/08/26 Javascript
BetterScroll 在移动端滚动场景的应用
2017/09/18 Javascript
JS动态插入脚本和插入引用外部链接脚本的方法
2018/05/21 Javascript
jQuery实现基本淡入淡出效果的方法详解
2018/09/05 jQuery
Centos7 Python3下安装scrapy的详细步骤
2018/03/15 Python
java判断三位数的实例讲解
2019/06/10 Python
django 扩展user用户字段inlines方式
2020/03/30 Python
浅谈python 调用open()打开文件时路径出错的原因
2020/06/05 Python
Pycharm中配置远程Docker运行环境的教程图解
2020/06/11 Python
解决pip安装的第三方包在PyCharm无法导入的问题
2020/10/15 Python
HTML5中的Web Notification桌面通知功能的实现方法
2019/07/29 HTML / CSS
森海塞尔美国官网:Sennheiser耳机与耳麦
2017/07/19 全球购物
注塑工厂厂长岗位职责
2013/12/02 职场文书
信息技术专业个人自我评价
2013/12/11 职场文书
门卫人员岗位职责
2013/12/24 职场文书
家长给孩子的评语
2014/01/30 职场文书
出国留学经济担保书
2014/04/01 职场文书
房产公证书范本
2014/04/10 职场文书
安全生产月活动总结
2014/05/04 职场文书
计算机专业毕业生自荐书
2014/06/02 职场文书
真诚的求职信
2014/07/04 职场文书
党员违纪检讨书
2015/05/05 职场文书
幼儿教师师德培训心得体会
2016/01/09 职场文书
三十年再续同学情倡议书
2019/11/27 职场文书
使用canvas对video视频某一刻截图功能
2021/09/25 HTML / CSS