编程 Python

Python requests获取网页常用方法解析

Posted in Python onFebruary 20, 2020

这篇文章主要介绍了Python requests获取网页常用方法解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

主要记录使用 requests 模块获取网页源码的方法

class Crawler(object):
 """
 采集类
 """
 def __init__(self, base_url):
  self._base_url = base_url
  self._cookie = None
  self._getCookie()

 def _getCookie(self):
  """
  获取站点cookie
  :return:
  """
  try:
   res = requests.get(self._base_url)
   res.raise_for_status()
   # TODO response.cookies获取到的是一个cookiejar对象，需要使用requests.utils.dict_from_cookiejar来
   # TODO 将cookiejar对象转换为一个字典，这个字典后续使用的时候，在请求时直接传入就可以了，
   # 如 requests.get(url, cookies=cookies)
   self._cookie = requests.utils.dict_from_cookiejar(res.cookies)
   print self._cookie
  except Exception as e:
   print e

 def get_html_text(self, url, **kwargs):
  """
  爬取网页的通用代码框架
  :param url:
  :param method:
  :param kwargs:
  :return:
  """
  try:
   kwargs.setdefault('cookies', self._cookie)
   res = requests.get(url, **kwargs)
   # TODO 若响应状态码不是200, 抛出 HTTPError 异常
   res.raise_for_status()
   res.encoding = res.apparent_encoding
   # print requests.utils.dict_from_cookiejar(res.cookies)
   return res.text
  except Exception as e:
   print traceback.print_exc()
   return

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

Python requests获取网页常用方法解析

- Author -

酸果实爱吐泡泡的鱼

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python网络爬虫实例讲解

Apr 28 Python

python 实现红包随机生成算法的简单实例

Jan 04 Python

详解Golang 与python中的字符串反转

Jul 21 Python

python对配置文件.ini进行增删改查操作的方法示例

Jul 28 Python

基于Python中capitalize()与title()的区别详解

Dec 09 Python

代码讲解Python对Windows服务进行监控

Feb 11 Python

python如何在循环引用中管理内存

Mar 20 Python

详解Python3 中hasattr()、getattr()、setattr()、delattr()函数及示例代码数

Apr 18 Python

详解python websocket获取实时数据的几种常见链接方式

Jul 01 Python

PyQt+socket实现远程操作服务器的方法示例

Aug 22 Python

python使用SQLAlchemy操作MySQL

Jan 02 Python

详解anaconda安装步骤

Nov 23 Python

pytorch实现保证每次运行使用的随机数都相同

Feb 20 #Python

Python argparse模块使用方法解析

Feb 20 #Python

浅谈pytorch torch.backends.cudnn设置作用

Feb 20 #Python

Python sqlite3查询操作过程解析

Feb 20 #Python

python利用datetime模块计算程序运行时间问题

Feb 20 #Python

pytorch数据预处理错误的解决

Feb 20 #Python

Python异常继承关系和自定义异常实现代码实例

Feb 20 #Python

You might like

php获取文件夹路径内的图片以及分页显示示例

2014/03/11 PHP

PHP生成自定义长度随机字符串的函数分享

2014/05/04 PHP

JavaScript 输入框内容格式验证代码

2010/02/11 Javascript

JQuery防止退格键网页后退的实现代码

2012/03/23 Javascript

jquery仿京东导航/仿淘宝商城左侧分类导航下拉菜单效果

2013/04/24 Javascript

jquery弹出关闭遮罩层实例

2013/08/06 Javascript

对比分析json及XML

2014/11/28 Javascript

jQuery实现可关闭固定于底（顶）部的工具条菜单效果

2015/11/06 Javascript

分享一道关于闭包、bind和this的面试题

2017/02/20 Javascript

Angular2 Service实现简单音乐播放器服务

2017/02/24 Javascript

JS FormData上传文件的设置方法

2017/07/05 Javascript

详解Angular4 路由设置相关

2017/08/26 Javascript

BetterScroll 在移动端滚动场景的应用

2017/09/18 Javascript

JS动态插入脚本和插入引用外部链接脚本的方法

2018/05/21 Javascript

jQuery实现基本淡入淡出效果的方法详解

2018/09/05 jQuery

Centos7 Python3下安装scrapy的详细步骤

2018/03/15 Python

java判断三位数的实例讲解

2019/06/10 Python

django 扩展user用户字段inlines方式

2020/03/30 Python

浅谈python 调用open()打开文件时路径出错的原因

2020/06/05 Python

Pycharm中配置远程Docker运行环境的教程图解

2020/06/11 Python

解决pip安装的第三方包在PyCharm无法导入的问题

2020/10/15 Python

HTML5中的Web Notification桌面通知功能的实现方法

2019/07/29 HTML / CSS

森海塞尔美国官网：Sennheiser耳机与耳麦

2017/07/19 全球购物

注塑工厂厂长岗位职责

2013/12/02 职场文书

信息技术专业个人自我评价

2013/12/11 职场文书

门卫人员岗位职责

2013/12/24 职场文书

家长给孩子的评语

2014/01/30 职场文书

出国留学经济担保书

2014/04/01 职场文书

房产公证书范本

2014/04/10 职场文书

安全生产月活动总结

2014/05/04 职场文书

计算机专业毕业生自荐书

2014/06/02 职场文书

真诚的求职信

2014/07/04 职场文书

党员违纪检讨书

2015/05/05 职场文书

幼儿教师师德培训心得体会

2016/01/09 职场文书

三十年再续同学情倡议书

2019/11/27 职场文书

使用canvas对video视频某一刻截图功能

2021/09/25 HTML / CSS