python爬虫基础教程:requests库(二)代码实例


Posted in Python onApril 09, 2019

get请求

简单使用

import requests
'''
想要学习Python?Python学习交流群:973783996满足你的需求,资料都已经上传群文件,可以自行下载!
'''
response = requests.get("https://www.baidu.com/")
#text返回的是unicode的字符串,可能会出现乱码情况
# print(response.text)
 
#content返回的是字节,需要解码
print(response.content.decode('utf-8'))
 
 
# print(response.url)       #https://www.baidu.com/
# print(response.status_code)   #200
# print(response.encoding)    #ISO-8859-1

添加headers和params

import requests
 
params = {
  'wd':'python'
}
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
}
 
response = requests.get("https://www.baidu.com/s",params=params,headers=headers)
 
#content返回的是字节,需要解码
with open('baidu.html','w',encoding='utf-8') as f:
  f.write(response.content.decode('utf-8'))

POST请求

爬去拉钩网职位信息

import requests
 
url = "https://www.lagou.com/jobs/positionAjax.json?city=%E5%8C%97%E4%BA%AC&needAddtionalResult=false"
 
data = {
  'first':'true',
  'pn':1,
  'kd':'python'
}
 
headers = {
  "User-Agent":"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36",
  "Referer":"https://www.lagou.com/jobs/list_python?city=%E5%8C%97%E4%BA%AC&cl=false&fromSearch=true&labelWords=&suginput="
}
 
response = requests.post(url,data=data,headers=headers)
# print(response.text)
print(type(response.text))    #<class 'str'>
print(type(response.json()))   #<class 'dict'>
 
print(response.json())      #获取为字典的形式

使用代理

import requests
 
proxy = {'http':'115.210.31.236.55:9000'}
 
response = requests.get("https://www.baidu.com/",proxies=proxy)
 
print(response.content.decode('utf-8'))

session登录

# _*_ coding:utf-8 _*_
 
import requests
 
# 1. 创建session对象,可以保存Cookie值
ssion = requests.session()
 
# 2. 处理 headers
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36'}
 
# 3. 需要登录的用户名和密码
data = {"email":"158xxxxxxxx", "password":"pythonxxxxxxx"}
 
# 4. 发送附带用户名和密码的请求,并获取登录后的Cookie值,保存在ssion里
ssion.post("http://www.renren.com/PLogin.do", data = data)
 
# 5. ssion包含用户登录后的Cookie值,可以直接访问那些登录后才可以访问的页面
response = ssion.get("http://zhibo.renren.com/news/108")
 
# 6. 打印响应内容
print(response.text)
 

以上所述是小编给大家介绍的python爬虫基础教程:requests库(二)详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
python正则表达式match和search用法实例
Mar 26 Python
Python3中的2to3转换工具使用示例
Jun 12 Python
使用Python操作excel文件的实例代码
Oct 15 Python
利用django+wechat-python-sdk 创建微信服务器接入的方法
Feb 20 Python
Django学习笔记之为Model添加Action
Apr 30 Python
详解DeBug Python神级工具PySnooper
Jul 03 Python
python 使用pygame工具包实现贪吃蛇游戏(多彩版)
Oct 30 Python
Python操作MySQL数据库实例详解【安装、连接、增删改查等】
Jan 17 Python
python tqdm 实现滚动条不上下滚动代码(保持一行内滚动)
Feb 19 Python
Python 使用 environs 库定义环境变量的方法
Feb 25 Python
tensorflow dataset.shuffle、dataset.batch、dataset.repeat顺序区别详解
Jun 03 Python
Django中Aggregation聚合的基本使用方法
Jul 09 Python
一个可以套路别人的python小程序实例代码
Apr 09 #Python
Python装饰器限制函数运行时间超时则退出执行
Apr 09 #Python
详解Python 解压缩文件
Apr 09 #Python
Python使用pandas和xlsxwriter读写xlsx文件的方法示例
Apr 09 #Python
Python中使用logging和traceback模块记录日志和跟踪异常
Apr 09 #Python
由Python编写的MySQL管理工具代码实例
Apr 09 #Python
python实现爬山算法的思路详解
Apr 09 #Python
You might like
深入PHP内存相关的功能特性详解
2013/06/08 PHP
PHP获取当前页面URL函数实例
2014/10/22 PHP
PHP实现基于3DES算法加密解密字符串示例
2018/08/24 PHP
Thinkphp5.0框架的Db操作实例分析【连接、增删改查、链式操作等】
2019/10/11 PHP
PHP发送邮件确认验证注册功能示例【修改别人邮件类】
2019/11/09 PHP
YII2框架使用控制台命令的方法分析
2020/03/18 PHP
不错的JS中变量相关的细节分析
2007/08/13 Javascript
js中scrollHeight,scrollWidth,scrollLeft,scrolltop等差别介绍
2012/05/16 Javascript
关于jQuery参考实例 1.0 jQuery的哲学
2013/04/07 Javascript
实例讲解JS中数组Array的操作方法
2014/05/09 Javascript
一个JavaScript处理textarea中的字符成每一行实例
2014/09/22 Javascript
js精美的幻灯片画集特效代码分享
2015/08/29 Javascript
JavaScript如何实现组合列表框中元素移动效果
2016/03/01 Javascript
基于jquery实现轮播焦点图插件
2016/03/31 Javascript
深入理解js中this的用法
2016/05/28 Javascript
jQuery实现一个简单的验证码功能
2017/06/26 jQuery
D3.js实现拓扑图的示例代码
2018/06/30 Javascript
jQuery Ajax实现Select多级关联动态绑定数据的实例代码
2018/10/26 jQuery
详解VS Code使用之Vue工程配置format代码格式化
2019/03/20 Javascript
Python基类函数的重载与调用实例分析
2015/01/12 Python
Python实现抓取页面上链接的简单爬虫分享
2015/01/21 Python
在Python的Django框架中实现Hacker News的一些功能
2015/04/17 Python
python实现中文输出的两种方法
2015/05/09 Python
Python进阶学习之特殊方法实例详析
2017/12/01 Python
使用python中的in ,not in来检查元素是不是在列表中的方法
2018/07/06 Python
matplotlib给子图添加图例的方法
2018/08/03 Python
Python使用matplotlib实现交换式图形显示功能示例
2019/09/06 Python
浅谈HTML5 defer和async的区别
2016/06/07 HTML / CSS
洲际酒店集团大中华区:IHG中国
2016/08/17 全球购物
英国豪华家具和家居用品购物网站:Teddy Beau
2020/10/12 全球购物
澳大利亚厨房和家用电器购物网站:Bing Lee
2021/01/11 全球购物
Prototype如何实现页面局部定时刷新
2013/08/06 面试题
模范教师事迹材料
2014/02/10 职场文书
2014乡党委副书记党建工作汇报材料
2014/11/02 职场文书
两行代码解决Jupyter Notebook中文不能显示的问题
2021/04/24 Python
maven依赖的version声明控制方式
2022/01/18 Java/Android