python爬虫基础教程:requests库(二)代码实例


Posted in Python onApril 09, 2019

get请求

简单使用

import requests
'''
想要学习Python?Python学习交流群:973783996满足你的需求,资料都已经上传群文件,可以自行下载!
'''
response = requests.get("https://www.baidu.com/")
#text返回的是unicode的字符串,可能会出现乱码情况
# print(response.text)
 
#content返回的是字节,需要解码
print(response.content.decode('utf-8'))
 
 
# print(response.url)       #https://www.baidu.com/
# print(response.status_code)   #200
# print(response.encoding)    #ISO-8859-1

添加headers和params

import requests
 
params = {
  'wd':'python'
}
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
}
 
response = requests.get("https://www.baidu.com/s",params=params,headers=headers)
 
#content返回的是字节,需要解码
with open('baidu.html','w',encoding='utf-8') as f:
  f.write(response.content.decode('utf-8'))

POST请求

爬去拉钩网职位信息

import requests
 
url = "https://www.lagou.com/jobs/positionAjax.json?city=%E5%8C%97%E4%BA%AC&needAddtionalResult=false"
 
data = {
  'first':'true',
  'pn':1,
  'kd':'python'
}
 
headers = {
  "User-Agent":"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36",
  "Referer":"https://www.lagou.com/jobs/list_python?city=%E5%8C%97%E4%BA%AC&cl=false&fromSearch=true&labelWords=&suginput="
}
 
response = requests.post(url,data=data,headers=headers)
# print(response.text)
print(type(response.text))    #<class 'str'>
print(type(response.json()))   #<class 'dict'>
 
print(response.json())      #获取为字典的形式

使用代理

import requests
 
proxy = {'http':'115.210.31.236.55:9000'}
 
response = requests.get("https://www.baidu.com/",proxies=proxy)
 
print(response.content.decode('utf-8'))

session登录

# _*_ coding:utf-8 _*_
 
import requests
 
# 1. 创建session对象,可以保存Cookie值
ssion = requests.session()
 
# 2. 处理 headers
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36'}
 
# 3. 需要登录的用户名和密码
data = {"email":"158xxxxxxxx", "password":"pythonxxxxxxx"}
 
# 4. 发送附带用户名和密码的请求,并获取登录后的Cookie值,保存在ssion里
ssion.post("http://www.renren.com/PLogin.do", data = data)
 
# 5. ssion包含用户登录后的Cookie值,可以直接访问那些登录后才可以访问的页面
response = ssion.get("http://zhibo.renren.com/news/108")
 
# 6. 打印响应内容
print(response.text)
 

以上所述是小编给大家介绍的python爬虫基础教程:requests库(二)详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
Python的GUI框架PySide的安装配置教程
Feb 16 Python
详解Python中heapq模块的用法
Jun 28 Python
ansible作为python模块库使用的方法实例
Jan 17 Python
Python正则表达式经典入门教程
May 22 Python
Python实现的简单读写csv文件操作示例
Jul 12 Python
代码详解django中数据库设置
Jan 28 Python
使用pandas读取文件的实现
Jul 31 Python
详解python 利用echarts画地图(热力图)(世界地图,省市地图,区县地图)
Aug 06 Python
Python3.7 读取 mp3 音频文件生成波形图效果
Nov 05 Python
Python求正态分布曲线下面积实例
Nov 20 Python
python编程进阶之类和对象用法实例分析
Feb 21 Python
Python中读取文件名中的数字的实例详解
Dec 25 Python
一个可以套路别人的python小程序实例代码
Apr 09 #Python
Python装饰器限制函数运行时间超时则退出执行
Apr 09 #Python
详解Python 解压缩文件
Apr 09 #Python
Python使用pandas和xlsxwriter读写xlsx文件的方法示例
Apr 09 #Python
Python中使用logging和traceback模块记录日志和跟踪异常
Apr 09 #Python
由Python编写的MySQL管理工具代码实例
Apr 09 #Python
python实现爬山算法的思路详解
Apr 09 #Python
You might like
PHP投票系统防刷票判断流程分析
2012/02/04 PHP
浅析php中抽象类和接口的概念以及区别
2013/06/27 PHP
实现在同一方法中获取当前方法中新赋值的session值解决方法
2014/06/26 PHP
PHP的mysqli_select_db()函数讲解
2019/01/23 PHP
让插入到 innerHTML 中的 script 跑起来的实现代码
2006/07/01 Javascript
javascript 操作Word和Excel的实现代码
2009/10/26 Javascript
xheditor与validate插件冲突的解决方案
2010/04/15 Javascript
JQuery Highcharts 动态生成图表的方法
2013/11/15 Javascript
JavaScript中的slice()方法使用详解
2015/06/06 Javascript
正则表达式优化JSON字符串的技巧
2015/12/24 Javascript
wap手机端解决返回上一页的js实例
2016/12/08 Javascript
jQuery窗口拖动功能的实现代码
2017/02/04 Javascript
JQuery validate 验证一个单独的表单元素实例
2017/02/17 Javascript
详解打造 Vue.js 可复用组件
2017/03/24 Javascript
Angular2中select用法之设置默认值与事件详解
2017/05/07 Javascript
ionic选择多张图片上传的示例代码
2017/10/10 Javascript
Vue 自定义动态组件实例详解
2018/03/28 Javascript
vue使用transition组件动画效果的实例代码
2021/01/28 Vue.js
python实现解数独程序代码
2017/04/12 Python
python实现拓扑排序的基本教程
2018/03/11 Python
Python numpy 提取矩阵的某一行或某一列的实例
2018/04/03 Python
对python中Json与object转化的方法详解
2018/12/31 Python
python实现Dijkstra静态寻路算法
2019/01/17 Python
Python使用lambda表达式对字典排序操作示例
2019/07/25 Python
Django中的静态文件管理过程解析
2019/08/01 Python
Python使用matplotlib 模块scatter方法画散点图示例
2019/09/27 Python
Python进程Multiprocessing模块原理解析
2020/02/28 Python
Django Admin设置应用程序及模型顺序方法详解
2020/04/01 Python
如何理解python对象
2020/06/21 Python
聊聊python中的循环遍历
2020/09/07 Python
Foot Locker澳洲官网:美国运动服和鞋类零售商
2019/10/11 全球购物
毕业生自我鉴定
2013/11/05 职场文书
党支部创先争优活动总结
2014/08/28 职场文书
教师群众路线心得体会
2014/11/04 职场文书
仓库管理员岗位职责
2015/02/03 职场文书
一文搞懂php的垃圾回收机制
2021/06/18 PHP