python爬虫基础教程:requests库(二)代码实例


Posted in Python onApril 09, 2019

get请求

简单使用

import requests
'''
想要学习Python?Python学习交流群:973783996满足你的需求,资料都已经上传群文件,可以自行下载!
'''
response = requests.get("https://www.baidu.com/")
#text返回的是unicode的字符串,可能会出现乱码情况
# print(response.text)
 
#content返回的是字节,需要解码
print(response.content.decode('utf-8'))
 
 
# print(response.url)       #https://www.baidu.com/
# print(response.status_code)   #200
# print(response.encoding)    #ISO-8859-1

添加headers和params

import requests
 
params = {
  'wd':'python'
}
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
}
 
response = requests.get("https://www.baidu.com/s",params=params,headers=headers)
 
#content返回的是字节,需要解码
with open('baidu.html','w',encoding='utf-8') as f:
  f.write(response.content.decode('utf-8'))

POST请求

爬去拉钩网职位信息

import requests
 
url = "https://www.lagou.com/jobs/positionAjax.json?city=%E5%8C%97%E4%BA%AC&needAddtionalResult=false"
 
data = {
  'first':'true',
  'pn':1,
  'kd':'python'
}
 
headers = {
  "User-Agent":"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36",
  "Referer":"https://www.lagou.com/jobs/list_python?city=%E5%8C%97%E4%BA%AC&cl=false&fromSearch=true&labelWords=&suginput="
}
 
response = requests.post(url,data=data,headers=headers)
# print(response.text)
print(type(response.text))    #<class 'str'>
print(type(response.json()))   #<class 'dict'>
 
print(response.json())      #获取为字典的形式

使用代理

import requests
 
proxy = {'http':'115.210.31.236.55:9000'}
 
response = requests.get("https://www.baidu.com/",proxies=proxy)
 
print(response.content.decode('utf-8'))

session登录

# _*_ coding:utf-8 _*_
 
import requests
 
# 1. 创建session对象,可以保存Cookie值
ssion = requests.session()
 
# 2. 处理 headers
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36'}
 
# 3. 需要登录的用户名和密码
data = {"email":"158xxxxxxxx", "password":"pythonxxxxxxx"}
 
# 4. 发送附带用户名和密码的请求,并获取登录后的Cookie值,保存在ssion里
ssion.post("http://www.renren.com/PLogin.do", data = data)
 
# 5. ssion包含用户登录后的Cookie值,可以直接访问那些登录后才可以访问的页面
response = ssion.get("http://zhibo.renren.com/news/108")
 
# 6. 打印响应内容
print(response.text)
 

以上所述是小编给大家介绍的python爬虫基础教程:requests库(二)详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python 上下文管理器使用方法小结
Oct 10 Python
win8下python3.4安装和环境配置图文教程
Jul 31 Python
python使用递归的方式建立二叉树
Jul 03 Python
pycharm中显示CSS提示的知识点总结
Jul 29 Python
Python re 模块findall() 函数返回值展现方式解析
Aug 09 Python
通过Python编写一个简单登录功能过程解析
Sep 04 Python
Python中输入和输出(打印)数据实例方法
Oct 13 Python
python 实现分组求和与分组累加求和代码
May 18 Python
通过实例了解Python异常处理机制底层实现
Jul 23 Python
Python return语句如何实现结果返回调用
Oct 15 Python
教你怎么用Python操作MySql数据库
May 31 Python
C站最全Python标准库总结,你想要的都在这里
Jul 03 Python
一个可以套路别人的python小程序实例代码
Apr 09 #Python
Python装饰器限制函数运行时间超时则退出执行
Apr 09 #Python
详解Python 解压缩文件
Apr 09 #Python
Python使用pandas和xlsxwriter读写xlsx文件的方法示例
Apr 09 #Python
Python中使用logging和traceback模块记录日志和跟踪异常
Apr 09 #Python
由Python编写的MySQL管理工具代码实例
Apr 09 #Python
python实现爬山算法的思路详解
Apr 09 #Python
You might like
用来给图片加水印的PHP类
2008/04/09 PHP
PHP高级对象构建 多个构造函数的使用
2012/02/05 PHP
php模板函数 正则实现代码
2012/10/15 PHP
PHP PDOStatement::setFetchMode讲解
2019/02/03 PHP
基于jQuery UI CSS Framework开发Widget的经验
2010/08/21 Javascript
获取服务器传来的数据 用JS去空格的正则表达式
2012/03/26 Javascript
jquery图片不完全按比例自动缩小的简单代码
2013/07/29 Javascript
JavaScript学习笔记之JS函数
2015/01/22 Javascript
jQuery选择器源码解读(七):elementMatcher函数
2015/03/31 Javascript
整理Javascript基础语法学习笔记
2015/11/29 Javascript
微信小程序  action-sheet详解及实例代码
2016/11/09 Javascript
js简单正则验证汉字英文及下划线的方法
2016/11/28 Javascript
基于zepto.js实现手机相册功能
2017/07/11 Javascript
vue 中swiper的使用教程
2018/05/22 Javascript
详解几十行代码实现一个vue的状态管理
2019/01/28 Javascript
通过循环优化 JavaScript 程序
2019/06/24 Javascript
vue 实现特定条件下绑定事件
2019/11/09 Javascript
vue实现计算器功能
2020/02/22 Javascript
[00:36]DOTA2上海特级锦标赛 Archon战队宣传片
2016/03/04 DOTA
[50:12]EG vs Fnatic 2018国际邀请赛小组赛BO2 第二场 8.19
2018/08/21 DOTA
[01:52]2020年DOTA2 TI10夏季活动预告片
2020/07/15 DOTA
Python自动化测试Eclipse+Pydev 搭建开发环境
2016/08/15 Python
Django框架静态文件使用/中间件/禁用ip功能实例详解
2019/07/22 Python
Python 文件操作之读取文件(read),文件指针与写入文件(write),文件打开方式示例
2019/09/29 Python
pyCharm 实现关闭代码检查
2020/06/09 Python
如何利用Python 进行边缘检测
2020/10/14 Python
Python操控mysql批量插入数据的实现方法
2020/10/27 Python
Python 将代码转换为可执行文件脱离python环境运行(步骤详解)
2021/01/25 Python
全球独特生活方式产品和礼品购物网站:AHAlife
2018/09/18 全球购物
美国汽车零部件和配件网站:CarParts
2019/03/13 全球购物
线程的基本概念、线程的基本状态以及状态之间的关系
2012/10/26 面试题
市场营销管理制度
2014/01/29 职场文书
单位考核聘任报告
2015/03/02 职场文书
小学英语教学反思范文
2016/02/15 职场文书
星际争霸:毕姥爷vs解冻01
2022/04/01 星际争霸
Pandas实现批量拆分与合并Excel的示例代码
2022/05/30 Python