Python requests获取网页常用方法解析


Posted in Python onFebruary 20, 2020

这篇文章主要介绍了Python requests获取网页常用方法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

主要记录使用 requests 模块获取网页源码的方法

class Crawler(object):
 """
 采集类
 """
 def __init__(self, base_url):
  self._base_url = base_url
  self._cookie = None
  self._getCookie()

 def _getCookie(self):
  """
  获取站点cookie
  :return:
  """
  try:
   res = requests.get(self._base_url)
   res.raise_for_status()
   # TODO response.cookies获取到的是一个cookiejar对象,需要使用requests.utils.dict_from_cookiejar来
   # TODO 将cookiejar对象转换为一个字典,这个字典后续使用的时候,在请求时直接传入就可以了,
   # 如 requests.get(url, cookies=cookies)
   self._cookie = requests.utils.dict_from_cookiejar(res.cookies)
   print self._cookie
  except Exception as e:
   print e

 def get_html_text(self, url, **kwargs):
  """
  爬取网页的通用代码框架
  :param url:
  :param method:
  :param kwargs:
  :return:
  """
  try:
   kwargs.setdefault('cookies', self._cookie)
   res = requests.get(url, **kwargs)
   # TODO 若响应状态码不是200, 抛出 HTTPError 异常
   res.raise_for_status()
   res.encoding = res.apparent_encoding
   # print requests.utils.dict_from_cookiejar(res.cookies)
   return res.text
  except Exception as e:
   print traceback.print_exc()
   return

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python闭包函数定义与用法分析
Jul 20 Python
python3 unicode列表转换为中文的实例
Oct 26 Python
python调用c++传递数组的实例
Feb 13 Python
关于阿里云oss获取sts凭证 app直传 python的实例
Aug 20 Python
Python爬取破解无线网络wifi密码过程解析
Sep 17 Python
django中瀑布流写法实例代码
Oct 14 Python
python 协程 gevent原理与用法分析
Nov 22 Python
Tensorflow进行多维矩阵的拆分与拼接实例
Feb 07 Python
python isinstance函数用法详解
Feb 13 Python
Python json解析库jsonpath原理及使用示例
Nov 25 Python
Pycharm plot独立窗口显示的操作
Dec 11 Python
Python写情书? 10行代码展示如何把情书写在她的照片里
Apr 21 Python
pytorch实现保证每次运行使用的随机数都相同
Feb 20 #Python
Python argparse模块使用方法解析
Feb 20 #Python
浅谈pytorch torch.backends.cudnn设置作用
Feb 20 #Python
Python sqlite3查询操作过程解析
Feb 20 #Python
python利用datetime模块计算程序运行时间问题
Feb 20 #Python
pytorch数据预处理错误的解决
Feb 20 #Python
Python异常继承关系和自定义异常实现代码实例
Feb 20 #Python
You might like
解析php中获取url与物理路径的总结
2013/06/21 PHP
Java和PHP在Web开发方面对比分析
2015/03/01 PHP
php从字符串创建函数的方法
2015/03/16 PHP
索趣科技的答案
2007/02/07 Javascript
JavaScript中的Array对象使用说明
2011/01/17 Javascript
js验证是否为数字的总结
2013/04/14 Javascript
Jquery submit()无法提交问题
2013/04/21 Javascript
JavaScript等比例缩放图片控制超出范围的图片
2013/08/06 Javascript
Js与下拉列表处理问题解决
2014/02/13 Javascript
Javascript中的String对象详谈
2014/03/03 Javascript
jquery中表单 多选框的一种巧妙写法
2015/09/06 Javascript
jQuery根据name属性进行查找的用法分析
2016/06/23 Javascript
AngularJS国际化详解及示例代码
2016/08/18 Javascript
微信小程序  audio音频播放详解及实例
2016/11/02 Javascript
JS中去掉array中重复元素的方法
2017/05/26 Javascript
JS实现问卷星自动填问卷脚本并在两秒自动提交功能
2020/06/17 Javascript
Node.js console控制台简单用法分析
2019/01/04 Javascript
NodeJs操作MongoDB教程之分页功能以及常见问题
2019/04/09 NodeJs
vue+elementUI实现表格关键字筛选高亮
2020/10/26 Javascript
iSlider手机端图片滑动切换插件使用详解
2019/12/24 Javascript
Node.js API详解之 readline模块用法详解
2020/05/22 Javascript
[54:24]Optic vs TNC 2018国际邀请赛小组赛BO2 第二场
2018/08/18 DOTA
基于wxpython实现的windows GUI程序实例
2015/05/30 Python
windows下python和pip安装教程
2018/05/25 Python
python 字典中文key处理,读取,比较方法
2018/07/06 Python
详解Python 切片语法
2019/06/10 Python
python使用socket 先读取长度,在读取报文内容示例
2019/09/26 Python
python等待10秒执行下一命令的方法
2020/07/19 Python
CSS3 简写animation
2012/05/10 HTML / CSS
在校生党员自我评价
2013/09/25 职场文书
校园学雷锋活动月总结
2014/03/09 职场文书
表决心的诗句大全
2014/03/11 职场文书
拾金不昧感谢信
2015/01/21 职场文书
2019生态环境保护倡议书!
2019/07/03 职场文书
《成长的天空》读后感3篇
2019/12/06 职场文书
python字符串拼接.join()和拆分.split()详解
2021/11/23 Python