python爬虫基础教程:requests库(二)代码实例


Posted in Python onApril 09, 2019

get请求

简单使用

import requests
'''
想要学习Python?Python学习交流群:973783996满足你的需求,资料都已经上传群文件,可以自行下载!
'''
response = requests.get("https://www.baidu.com/")
#text返回的是unicode的字符串,可能会出现乱码情况
# print(response.text)
 
#content返回的是字节,需要解码
print(response.content.decode('utf-8'))
 
 
# print(response.url)       #https://www.baidu.com/
# print(response.status_code)   #200
# print(response.encoding)    #ISO-8859-1

添加headers和params

import requests
 
params = {
  'wd':'python'
}
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
}
 
response = requests.get("https://www.baidu.com/s",params=params,headers=headers)
 
#content返回的是字节,需要解码
with open('baidu.html','w',encoding='utf-8') as f:
  f.write(response.content.decode('utf-8'))

POST请求

爬去拉钩网职位信息

import requests
 
url = "https://www.lagou.com/jobs/positionAjax.json?city=%E5%8C%97%E4%BA%AC&needAddtionalResult=false"
 
data = {
  'first':'true',
  'pn':1,
  'kd':'python'
}
 
headers = {
  "User-Agent":"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36",
  "Referer":"https://www.lagou.com/jobs/list_python?city=%E5%8C%97%E4%BA%AC&cl=false&fromSearch=true&labelWords=&suginput="
}
 
response = requests.post(url,data=data,headers=headers)
# print(response.text)
print(type(response.text))    #<class 'str'>
print(type(response.json()))   #<class 'dict'>
 
print(response.json())      #获取为字典的形式

使用代理

import requests
 
proxy = {'http':'115.210.31.236.55:9000'}
 
response = requests.get("https://www.baidu.com/",proxies=proxy)
 
print(response.content.decode('utf-8'))

session登录

# _*_ coding:utf-8 _*_
 
import requests
 
# 1. 创建session对象,可以保存Cookie值
ssion = requests.session()
 
# 2. 处理 headers
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36'}
 
# 3. 需要登录的用户名和密码
data = {"email":"158xxxxxxxx", "password":"pythonxxxxxxx"}
 
# 4. 发送附带用户名和密码的请求,并获取登录后的Cookie值,保存在ssion里
ssion.post("http://www.renren.com/PLogin.do", data = data)
 
# 5. ssion包含用户登录后的Cookie值,可以直接访问那些登录后才可以访问的页面
response = ssion.get("http://zhibo.renren.com/news/108")
 
# 6. 打印响应内容
print(response.text)
 

以上所述是小编给大家介绍的python爬虫基础教程:requests库(二)详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
零基础写python爬虫之打包生成exe文件
Nov 06 Python
编写同时兼容Python2.x与Python3.x版本的代码的几个示例
Mar 30 Python
Python3一行代码实现图片文字识别的示例
Jan 15 Python
python机器学习理论与实战(一)K近邻法
Jan 28 Python
在python win系统下 打开TXT文件的实例
Apr 29 Python
Python面向对象编程基础实例分析
Jan 17 Python
python GUI库图形界面开发之PyQt5信号与槽机制、自定义信号基础介绍
Feb 25 Python
python矩阵运算,转置,逆运算,共轭矩阵实例
May 11 Python
python如何利用Mitmproxy抓包
Oct 10 Python
python Xpath语法的使用
Nov 26 Python
OpenCV3.3+Python3.6实现图片高斯模糊
May 18 Python
Python Django框架介绍之模板标签及模板的继承
May 27 Python
一个可以套路别人的python小程序实例代码
Apr 09 #Python
Python装饰器限制函数运行时间超时则退出执行
Apr 09 #Python
详解Python 解压缩文件
Apr 09 #Python
Python使用pandas和xlsxwriter读写xlsx文件的方法示例
Apr 09 #Python
Python中使用logging和traceback模块记录日志和跟踪异常
Apr 09 #Python
由Python编写的MySQL管理工具代码实例
Apr 09 #Python
python实现爬山算法的思路详解
Apr 09 #Python
You might like
PHP下通过file_get_contents的代理使用方法
2011/02/16 PHP
CI框架数据库查询之join用法分析
2016/05/18 PHP
浅谈PHP表单提交(POST&amp;GET&amp;URL编/解码)
2017/04/03 PHP
php微信开发之图片回复功能
2018/06/14 PHP
PHP 爬取网页的主要方法
2018/07/13 PHP
javascript 打印内容方法小结
2009/11/04 Javascript
初识javascript 文档碎片
2010/07/13 Javascript
自己编写的类似JS的trim方法
2013/10/09 Javascript
整理Javascript事件响应学习笔记
2015/12/02 Javascript
Node.js模块封装及使用方法
2016/03/06 Javascript
基于JS分页控件实现简单美观仿淘宝分页按钮效果
2016/11/07 Javascript
移动适配的几种方案(三种方案)
2016/11/25 Javascript
详谈js遍历集合(Array,Map,Set)
2017/04/06 Javascript
angular中的cookie读写方法
2017/08/02 Javascript
jQuery中可见性过滤器简单用法示例
2018/03/31 jQuery
原生js实现自定义消息提示框
2020/11/19 Javascript
Python获取脚本所在目录的正确方法
2014/04/15 Python
python开发利器之ulipad的使用实践
2017/03/16 Python
flask中过滤器的使用详解
2018/08/01 Python
如何在Django配置文件里配置session链接
2019/08/06 Python
python实现美团订单推送到测试环境,提供便利操作示例
2019/08/09 Python
Python socket实现的文件下载器功能示例
2019/11/15 Python
django执行原始查询sql,并返回Dict字典例子
2020/04/01 Python
详解python 内存优化
2020/08/17 Python
英国运动风奢侈品购物网站:Maison De Fashion
2020/08/28 全球购物
TCP/IP模型的分界线
2012/12/01 面试题
如何拷贝一整个Java对象,包括它的状态
2013/12/27 面试题
中药专业自荐信范文
2014/03/18 职场文书
转让协议书范本
2014/04/15 职场文书
孝敬父母的演讲稿
2014/05/14 职场文书
车辆工程专业求职信
2014/06/14 职场文书
2015年安全教育月活动总结
2015/03/26 职场文书
导游词之河北滦平金山岭长城
2019/10/16 职场文书
nginx常用命令放入shell脚本详解
2021/03/31 Servers
python使用pycharm安装pyqt5以及相关配置
2022/04/22 Python
MySQL中的 inner join 和 left join的区别解析(小结果集驱动大结果集)
2023/05/08 MySQL