Python使用requests模块爬取百度翻译


Posted in Python onAugust 25, 2020

requests模块:

python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高。

作用:模拟浏览器发请求。

提示:老版使用 urllib模块,但requests比urllib模块要简单好用,现在学习requests模块即可!

requests模块编码流程

指定url

1.1 UA伪装

1.2 请求参数的处理

2.发起请求

3.获取响应数据

4.持久化存储

环境安装:

pip install requests

案例一:破解百度翻译(post请求)

1.代码如下:

#爬取百度翻译
#导入模块
import requests
import json

#UA伪装:将对应的User-Agent封装到一个字典中
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) '
           'Chrome/57.0.2987.98 Safari/537.36'}

  #网页访问连接
 url='https://fanyi.baidu.com/sug'
 #处理url携带的参数:封装到字典中
word=input("input a word: ")
data={
  'kw': word
}

#请求发送
res=requests.post(url=url,data=data,headers=headers)
#获取响应数据:json()方法返回的是obj(如果确认响应数据是json类型的,才可以使用json())
dic_obj=res.json()

#持久化存储
filename=word+'.json'
fp=open(filename,'w',encoding='utf-8')
json.dump(dic_obj,fp=fp,ensure_ascii=False)

#打印完成提示
print('finish')

其中:

https://fanyi.baidu.com/sug 这个url的定位如下图:

Python使用requests模块爬取百度翻译

2.运行结果

Python使用requests模块爬取百度翻译

Python使用requests模块爬取百度翻译

案例二:爬取搜狗页面数据(get请求)

1.代码如下

import requests
if __name__ == "__main__":
  #step_1:指定url
  url = 'https://www.sogou.com/'
  #step_2:发起请求
  #get方法会返回一个响应对象
  response = requests.get(url=url)
  #step_3:获取响应数据.text返回的是字符串形式的响应数据
  page_text = response.text
  print(page_text)
  #step_4:持久化存储
  with open('./sogou.html','w',encoding='utf-8') as fp:
    fp.write(page_text)
  print('爬取数据结束!!!')

2.运行结果如下:

Python使用requests模块爬取百度翻译

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python登录QQ邮箱发信的实现代码
Feb 10 Python
python输出当前目录下index.html文件路径的方法
Apr 28 Python
Python正规则表达式学习指南
Aug 02 Python
Python socket网络编程TCP/IP服务器与客户端通信
Jan 05 Python
python检测空间储存剩余大小和指定文件夹内存占用的实例
Jun 11 Python
Flask框架实现给视图函数增加装饰器操作示例
Jul 16 Python
FFrpc python客户端lib使用解析
Aug 24 Python
python文件和文件夹复制函数
Feb 07 Python
Python3打包exe代码2种方法实例解析
Feb 17 Python
jupyter notebook清除输出方式
Apr 10 Python
python opencv 实现读取、显示、写入图像的方法
Jun 08 Python
Python实现Excel自动分组合并单元格
Feb 22 Python
Python爬虫使用bs4方法实现数据解析
Aug 25 #Python
Python+Opencv身份证号码区域提取及识别实现
Aug 25 #Python
Python Selenium实现无可视化界面过程解析
Aug 25 #Python
一文读懂Python 枚举
Aug 25 #Python
详解python变量与数据类型
Aug 25 #Python
python获取百度热榜链接的实例方法
Aug 25 #Python
利用Python如何制作贪吃蛇及AI版贪吃蛇详解
Aug 24 #Python
You might like
php入门学习知识点二 PHP简单的分页过程与原理
2011/07/14 PHP
php结合正则批量抓取网页中邮箱地址
2015/05/19 PHP
php获取目录中所有文件名及判断文件与目录的简单方法
2017/03/04 PHP
jquery 简单图片导航插件jquery.imgNav.js
2010/03/17 Javascript
jQuery总体架构的理解分析
2011/03/07 Javascript
Javascript面向对象编程
2012/03/18 Javascript
JavaScript获取一个范围内日期的方法
2015/04/24 Javascript
深入分析下javascript中的[]()+!
2015/07/07 Javascript
购物车前端开发(jQuery和bootstrap3)
2016/08/27 Javascript
原生js实现放大镜特效
2017/03/08 Javascript
关于jquery form表单序列化的注意事项详解
2017/08/01 jQuery
使用JS组件实现带ToolTip验证框的实例代码
2017/08/23 Javascript
vue2.x集成百度UEditor富文本编辑器的方法
2018/09/21 Javascript
jQuery设置下拉框显示与隐藏效果的方法分析
2019/09/15 jQuery
[01:00:59]VP VS VG Supermajor小组赛胜者组第二轮 BO3第二场 6.2
2018/06/03 DOTA
python实现简单socket通信的方法
2016/04/19 Python
Python实现的简单模板引擎功能示例
2017/09/02 Python
详解python中__name__的意义以及作用
2019/08/07 Python
Python 使用matplotlib模块模拟掷骰子
2019/08/08 Python
Python range、enumerate和zip函数用法详解
2019/09/11 Python
keras.layer.input()用法说明
2020/06/16 Python
HTML5 transform三维立方体实现360无死角三维旋转效果
2014/08/22 HTML / CSS
amaze ui 的使用详细教程
2020/08/19 HTML / CSS
Mytheresa美国官网:德国知名的女性奢侈品电商
2017/05/27 全球购物
台湾最大银发乐活百货:乐龄网
2018/05/21 全球购物
仓库管理专业个人自我评价范文
2013/11/11 职场文书
汽车维修与检测专业应届生求职信
2013/11/12 职场文书
家庭教育先进个人事迹材料
2014/01/24 职场文书
幼儿园小班评语
2014/04/18 职场文书
施工安全协议书范本
2014/09/26 职场文书
创先争优承诺书
2015/01/20 职场文书
幼儿园辞职信
2015/05/13 职场文书
redis 限制内存使用大小的实现
2021/05/08 Redis
教你用python控制安卓手机
2021/05/13 Python
解决 Redis 秒杀超卖场景的高并发
2022/04/12 Redis
Golang jwt身份认证
2022/04/20 Golang