用Python爬取某乎手机APP数据


Posted in Python onJune 15, 2021

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

到此这篇关于用Python爬取某乎手机APP数据的文章就介绍到这了,更多相关Python爬取APP数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
跟老齐学Python之让人欢喜让人忧的迭代
Oct 02 Python
Python用于学习重要算法的模块pygorithm实例浅析
Aug 16 Python
python3中property使用方法详解
Apr 23 Python
分享8个非常流行的 Python 可视化工具包
Jun 05 Python
python实现抠图给证件照换背景源码
Aug 20 Python
Python箱型图处理离群点的例子
Dec 09 Python
Python 如何批量更新已安装的库
May 26 Python
PyTorch中model.zero_grad()和optimizer.zero_grad()用法
Jun 24 Python
获取python运行输出的数据并解析存为dataFrame实例
Jul 07 Python
django 获取字段最大值,最新的记录操作
Aug 09 Python
python实现自定义日志的具体方法
May 28 Python
Python学习之异常中的finally使用详解
Mar 16 Python
七个非常实用的Python工具包总结
python异常中else的实例用法
Jun 15 #Python
Python实现简单的猜单词
Python自动化爬取天眼查数据的实现
浅谈Python响应式类库RxPy
Jun 14 #Python
Python Django ORM连表正反操作技巧
Python scrapy爬取起点中文网小说榜单
You might like
PHP跳转页面的几种实现方法详解
2013/06/08 PHP
8个必备的PHP功能开发
2015/10/02 PHP
浅谈PHP的反射机制
2016/12/15 PHP
php实现微信分享朋友链接功能
2019/02/18 PHP
浏览器无法运行JAVA脚本的解决方法
2008/01/09 Javascript
JavaScript 调试器简介
2009/02/21 Javascript
JavaScript读取中文cookie时的乱码问题的解决方法
2009/10/14 Javascript
jquery.validate使用攻略 第一部
2010/07/01 Javascript
js跨域问题之跨域iframe自适应大小实现代码
2010/07/17 Javascript
javascript-简单的计算器实现步骤分解(附图)
2013/05/30 Javascript
js加入收藏夹代码(兼容ie/ff/op)
2014/05/16 Javascript
js实现点击左右按钮轮播图片效果实例
2015/01/29 Javascript
jQuery实现感应鼠标动画效果自动伸长的输入框实例
2015/02/24 Javascript
Vue.js学习记录之在元素与template中使用v-if指令实例
2017/06/27 Javascript
node.js 核心http模块,起一个服务器,返回一个页面的实例
2017/09/11 Javascript
Python连接mssql数据库编码问题解决方法
2015/01/01 Python
详解Python中的元组与逻辑运算符
2015/10/13 Python
python中urlparse模块介绍与使用示例
2017/11/19 Python
Python微信公众号开发平台
2018/01/25 Python
使用python实现抓取腾讯视频所有电影的爬虫
2019/04/15 Python
Django实现发送邮件功能
2019/07/18 Python
python将字符串转变成dict格式的实现
2019/11/18 Python
Python 多进程原理及实现
2020/12/21 Python
您的网上新华书店:文轩网
2016/08/24 全球购物
迪卡侬荷兰官网:Decathlon荷兰
2017/10/29 全球购物
为奢侈时尚带来了慈善元素:Olivela
2018/09/29 全球购物
同步和异步有何异同,在什么情况下分别使用他们?举例说明
2014/02/27 面试题
计算机学生的自我评价分享
2014/02/18 职场文书
国际经济与贸易专业大学生职业规划书
2014/03/01 职场文书
预备党员表决心书
2014/03/11 职场文书
幼儿园教师自我鉴定
2014/03/20 职场文书
《蝙蝠和雷达》教学反思
2014/04/23 职场文书
家庭贫困证明
2014/09/23 职场文书
优秀班干部主要事迹材料
2015/11/04 职场文书
2016中秋晚会开幕词
2016/03/03 职场文书
MySQL查询学习之基础查询操作
2021/05/08 MySQL