python爬虫基础教程:requests库(二)代码实例


Posted in Python onApril 09, 2019

get请求

简单使用

import requests
'''
想要学习Python?Python学习交流群:973783996满足你的需求,资料都已经上传群文件,可以自行下载!
'''
response = requests.get("https://www.baidu.com/")
#text返回的是unicode的字符串,可能会出现乱码情况
# print(response.text)
 
#content返回的是字节,需要解码
print(response.content.decode('utf-8'))
 
 
# print(response.url)       #https://www.baidu.com/
# print(response.status_code)   #200
# print(response.encoding)    #ISO-8859-1

添加headers和params

import requests
 
params = {
  'wd':'python'
}
headers = {
  'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36'
}
 
response = requests.get("https://www.baidu.com/s",params=params,headers=headers)
 
#content返回的是字节,需要解码
with open('baidu.html','w',encoding='utf-8') as f:
  f.write(response.content.decode('utf-8'))

POST请求

爬去拉钩网职位信息

import requests
 
url = "https://www.lagou.com/jobs/positionAjax.json?city=%E5%8C%97%E4%BA%AC&needAddtionalResult=false"
 
data = {
  'first':'true',
  'pn':1,
  'kd':'python'
}
 
headers = {
  "User-Agent":"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36",
  "Referer":"https://www.lagou.com/jobs/list_python?city=%E5%8C%97%E4%BA%AC&cl=false&fromSearch=true&labelWords=&suginput="
}
 
response = requests.post(url,data=data,headers=headers)
# print(response.text)
print(type(response.text))    #<class 'str'>
print(type(response.json()))   #<class 'dict'>
 
print(response.json())      #获取为字典的形式

使用代理

import requests
 
proxy = {'http':'115.210.31.236.55:9000'}
 
response = requests.get("https://www.baidu.com/",proxies=proxy)
 
print(response.content.decode('utf-8'))

session登录

# _*_ coding:utf-8 _*_
 
import requests
 
# 1. 创建session对象,可以保存Cookie值
ssion = requests.session()
 
# 2. 处理 headers
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.101 Safari/537.36'}
 
# 3. 需要登录的用户名和密码
data = {"email":"158xxxxxxxx", "password":"pythonxxxxxxx"}
 
# 4. 发送附带用户名和密码的请求,并获取登录后的Cookie值,保存在ssion里
ssion.post("http://www.renren.com/PLogin.do", data = data)
 
# 5. ssion包含用户登录后的Cookie值,可以直接访问那些登录后才可以访问的页面
response = ssion.get("http://zhibo.renren.com/news/108")
 
# 6. 打印响应内容
print(response.text)
 

以上所述是小编给大家介绍的python爬虫基础教程:requests库(二)详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!

Python 相关文章推荐
pip 错误unused-command-line-argument-hard-error-in-future解决办法
Jun 01 Python
Python Tkinter简单布局实例教程
Sep 03 Python
python3中set(集合)的语法总结分享
Mar 24 Python
windows 10下安装搭建django1.10.3和Apache2.4的方法
Apr 05 Python
python实现批量图片格式转换
Jun 16 Python
对python读写文件去重、RE、set的使用详解
Dec 11 Python
pandas的连接函数concat()函数的具体使用方法
Jul 09 Python
Pytorch 抽取vgg各层并进行定制化处理的方法
Aug 20 Python
解决Django中修改js css文件但浏览器无法及时与之改变的问题
Aug 31 Python
PIL包中Image模块的convert()函数的具体使用
Feb 26 Python
opencv python在视屏上截图功能的实现
Mar 05 Python
Python3标准库之dbm UNIX键-值数据库问题
Mar 24 Python
一个可以套路别人的python小程序实例代码
Apr 09 #Python
Python装饰器限制函数运行时间超时则退出执行
Apr 09 #Python
详解Python 解压缩文件
Apr 09 #Python
Python使用pandas和xlsxwriter读写xlsx文件的方法示例
Apr 09 #Python
Python中使用logging和traceback模块记录日志和跟踪异常
Apr 09 #Python
由Python编写的MySQL管理工具代码实例
Apr 09 #Python
python实现爬山算法的思路详解
Apr 09 #Python
You might like
php gzip压缩输出的实现方法
2013/04/27 PHP
PHP限制页面只能在微信自带浏览器访问的代码
2014/01/15 PHP
ThinkPHP登录功能的实现方法
2014/08/20 PHP
php微信公众平台开发(四)回复功能开发
2016/12/06 PHP
php判断IP地址是否在多个IP段内
2020/08/18 PHP
PhpStorm 2020.3:新增开箱即用的PHP 8属性(推荐)
2020/10/30 PHP
IE中createElement需要注意的一个问题
2010/07/13 Javascript
brook javascript框架介绍
2011/10/10 Javascript
jquery子元素过滤选择器使用示例
2013/06/24 Javascript
JS实现判断滚动条滚到页面底部并执行事件的方法
2014/12/18 Javascript
NodeJs基本语法和类型
2015/02/13 NodeJs
网站发布后Bootstrap框架引用woff字体无法正常显示的解决方法
2016/11/24 Javascript
详解angular中通过$location获取路径(参数)的写法
2017/03/21 Javascript
微信JSSDK调用微信扫一扫功能的方法
2017/07/25 Javascript
Node.js成为Web应用开发最佳选择的原因
2018/02/05 Javascript
解决Vue中mounted钩子函数获取节点高度出错问题
2018/05/18 Javascript
微信小程序表单验证form提交错误提示效果
2020/06/19 Javascript
关于angular引入ng-zorro的问题浅析
2020/09/09 Javascript
利用soaplib搭建webservice详细步骤和实例代码
2013/11/20 Python
python生成随机mac地址的方法
2015/03/16 Python
Python中super函数的用法
2017/11/17 Python
JavaScript中的模拟事件和自定义事件实例分析
2018/07/27 Python
Python 使用指定的网卡发送HTTP请求的实例
2019/08/21 Python
基于python实现学生信息管理系统
2019/11/22 Python
Python包,__init__.py功能与用法分析
2020/01/07 Python
django admin管理工具自定义时间区间筛选器DateRangeFilter介绍
2020/05/19 Python
python实现从ftp上下载文件的实例方法
2020/07/19 Python
PyQt中使用QtSql连接MySql数据库的方法
2020/07/28 Python
Python 实现键盘鼠标按键模拟
2020/11/18 Python
Hotels.com越南:酒店预订
2019/10/29 全球购物
什么是会话Bean
2015/05/14 面试题
Java Servlet的主要功能和作用是什么
2014/02/14 面试题
汽车机修工岗位职责
2014/03/06 职场文书
初三开学计划书
2014/04/27 职场文书
党委书记个人对照检查材料
2014/09/15 职场文书
辞职申请书范本
2019/05/20 职场文书