用Python爬取某乎手机APP数据


Posted in Python onJune 15, 2021

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

到此这篇关于用Python爬取某乎手机APP数据的文章就介绍到这了,更多相关Python爬取APP数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
在Python中使用HTML模版的教程
Apr 29 Python
Python处理文本文件中控制字符的方法
Feb 07 Python
python虚拟环境的安装配置图文教程
Oct 20 Python
python实现微信自动回复及批量添加好友功能
Jul 03 Python
np.dot()函数的用法详解
Jan 17 Python
利用Python如何实时检测自身内存占用
May 09 Python
python实现人像动漫化的示例代码
May 17 Python
解决Keras自带数据集与预训练model下载太慢问题
Jun 12 Python
Windows 平台做 Python 开发的最佳组合(推荐)
Jul 27 Python
详解python tcp编程
Aug 24 Python
浅析Python 中的 WSGI 接口和 WSGI 服务的运行
Dec 09 Python
python matplotlib工具栏源码探析三之添加、删除自定义工具项的案例详解
Feb 25 Python
七个非常实用的Python工具包总结
python异常中else的实例用法
Jun 15 #Python
Python实现简单的猜单词
Python自动化爬取天眼查数据的实现
浅谈Python响应式类库RxPy
Jun 14 #Python
Python Django ORM连表正反操作技巧
Python scrapy爬取起点中文网小说榜单
You might like
PHP以及MYSQL日期比较方法
2012/11/29 PHP
php使用Cookie实现和用户会话的方法
2015/01/21 PHP
PHP的压缩函数实现:gzencode、gzdeflate和gzcompress的区别
2016/01/27 PHP
Laravel4中的Validator验证扩展用法详解
2016/07/26 PHP
$()JS小技巧
2007/07/21 Javascript
JS添加删除一组文本框并对输入信息加以验证判断其正确性
2013/04/11 Javascript
js获取select标签选中值的两种方式
2014/01/09 Javascript
jquery中attr和prop的区别分析
2015/03/16 Javascript
JS实现点击按钮后框架内载入不同网页的方法
2015/05/05 Javascript
jQuery实现简易的天天爱消除小游戏
2015/10/16 Javascript
JS字符串的切分用法实例
2016/02/22 Javascript
微信小程序开发教程-手势解锁实例
2017/01/06 Javascript
jQuery插件FusionCharts绘制的2D条状图效果【附demo源码】
2017/05/13 jQuery
AngularJS入门教程一:路由用法初探
2017/05/27 Javascript
Grunt针对静态文件的压缩,版本控制打包的实例讲解
2017/09/29 Javascript
Vue在页面数据渲染完成之后的调用方法
2018/09/11 Javascript
ES6的Fetch异步请求的实现方法
2018/12/07 Javascript
使用Vue生成动态表单
2019/11/26 Javascript
详解如何在JS代码中消灭for循环
2019/12/11 Javascript
jQuery HTML css()方法与css类实例详解
2020/05/20 jQuery
解决vue项目获取dom元素宽高总是不准确问题
2020/07/29 Javascript
Python随机生成彩票号码的方法
2015/03/05 Python
Python三级目录展示的实现方法
2016/09/28 Python
Spartoo英国:欧洲最大的网上鞋店
2016/09/13 全球购物
跑步、骑行和铁人三项的高性能眼镜和服装:ROKA
2018/07/06 全球购物
天逸系统(武汉)有限公司Java笔试题
2015/12/29 面试题
艺校音乐专业自我鉴定范文
2014/03/01 职场文书
医院护士党的群众路线教育实践活动对照检查材料思想汇报
2014/10/04 职场文书
党的群众路线教育实践活动专题组织生活会发言材料
2014/10/17 职场文书
西安兵马俑导游词
2015/02/02 职场文书
烟台的海导游词
2015/02/02 职场文书
会计工作能力自我评价
2015/03/05 职场文书
上课迟到检讨书
2015/05/06 职场文书
鉴史问廉观后感
2015/06/10 职场文书
HTML基础详解(下)
2021/10/16 HTML / CSS
Python Pygame实战之塔防游戏的实现
2022/03/17 Python