用Python爬取某乎手机APP数据


Posted in Python onJune 15, 2021

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

到此这篇关于用Python爬取某乎手机APP数据的文章就介绍到这了,更多相关Python爬取APP数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python发送邮件示例(支持中文邮件标题)
Feb 16 Python
Python3访问并下载网页内容的方法
Jul 28 Python
Python实现的摇骰子猜大小功能小游戏示例
Dec 18 Python
Python扩展内置类型详解
Mar 26 Python
python进阶之多线程对同一个全局变量的处理方法
Nov 09 Python
在python中使用requests 模拟浏览器发送请求数据的方法
Dec 26 Python
python监控进程状态,记录重启时间及进程号的实例
Jul 15 Python
对python中url参数编码与解码的实例详解
Jul 25 Python
python 数据提取及拆分的实现代码
Aug 26 Python
如何配置关联Python 解释器 Anaconda的教程(图解)
Apr 30 Python
Python Json数据文件操作原理解析
May 09 Python
基于python实现判断字符串是否数字算法
Jul 10 Python
七个非常实用的Python工具包总结
python异常中else的实例用法
Jun 15 #Python
Python实现简单的猜单词
Python自动化爬取天眼查数据的实现
浅谈Python响应式类库RxPy
Jun 14 #Python
Python Django ORM连表正反操作技巧
Python scrapy爬取起点中文网小说榜单
You might like
php array_map array_multisort 高效处理多维数组排序
2009/06/11 PHP
教你在header中隐藏php的版本信息
2016/08/10 PHP
jQuery中size()方法用法实例
2014/12/27 Javascript
JQuery查找DOM节点的方法
2015/06/11 Javascript
借助FileReader实现将文件编码为Base64后通过AJAX上传
2015/12/24 Javascript
jQuery EasyUI封装简化操作
2016/09/18 Javascript
vue.js表格分页示例
2016/10/18 Javascript
Node.js连接MongoDB数据库产生的问题
2017/02/08 Javascript
基于js中的原型(全面讲解)
2017/09/19 Javascript
微信小程序授权获取用户详细信息openid的实例详解
2017/09/20 Javascript
Vue微信项目按需授权登录策略实践思路详解
2018/05/07 Javascript
微信小程序实现图片上传放大预览删除代码
2020/06/28 Javascript
详解Angular Karma测试的持续集成实践
2019/11/15 Javascript
Python中用post、get方式提交数据的方法示例
2017/09/22 Python
python实现手机通讯录搜索功能
2018/02/22 Python
opencv改变imshow窗口大小,窗口位置的方法
2018/04/02 Python
Python爬虫实现抓取京东店铺信息及下载图片功能示例
2018/08/07 Python
python判断文件是否存在,不存在就创建一个的实例
2019/02/18 Python
python通过http下载文件的方法详解
2019/07/26 Python
基于python二叉树的构造和打印例子
2019/08/09 Python
Python中Unittest框架的具体使用
2019/08/27 Python
英国最大的美妆产品在线零售商之一:Beauty Bay
2017/09/29 全球购物
捷克体育用品购物网站:D-sport
2017/12/28 全球购物
Room Mate Hotels美国:西班牙酒店品牌
2018/04/10 全球购物
英国邮购活的植物主要供应商:Gardening Direct
2019/01/28 全球购物
美国排名第一的泳池用品直接来源:In The Swim
2019/09/23 全球购物
最新远光软件笔试题面试题内容
2013/11/08 面试题
解释一下钝化(Swap out)
2016/12/26 面试题
儿媳婚宴答谢词
2014/01/14 职场文书
法制宣传月活动方案
2014/05/11 职场文书
党员承诺书范文
2014/05/19 职场文书
汽车运用工程专业求职信
2014/06/18 职场文书
英语课前三分钟演讲稿
2014/08/19 职场文书
看雷锋电影观后感
2015/06/10 职场文书
大学生暑假实习总结
2015/07/13 职场文书
学长教您写论文:经验总结
2019/07/09 职场文书