用Python爬取某乎手机APP数据


Posted in Python onJune 15, 2021

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

到此这篇关于用Python爬取某乎手机APP数据的文章就介绍到这了,更多相关Python爬取APP数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
分析python服务器拒绝服务攻击代码
Jan 16 Python
利用一个简单的例子窥探CPython内核的运行机制
Mar 30 Python
python实现识别相似图片小结
Feb 22 Python
python 获取网页编码方式实现代码
Mar 11 Python
Python实现图片滑动式验证识别方法
Nov 09 Python
python聚类算法解决方案(rest接口/mpp数据库/json数据/下载图片及数据)
Aug 28 Python
django框架基于queryset和双下划线的跨表查询操作详解
Dec 11 Python
python标准库sys和OS的函数使用方法与实例详解
Feb 12 Python
Python Json数据文件操作原理解析
May 09 Python
python统计mysql数据量变化并调用接口告警的示例代码
Sep 21 Python
用python实现一个简单计算器(完整DEMO)
Oct 14 Python
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 Python
七个非常实用的Python工具包总结
python异常中else的实例用法
Jun 15 #Python
Python实现简单的猜单词
Python自动化爬取天眼查数据的实现
浅谈Python响应式类库RxPy
Jun 14 #Python
Python Django ORM连表正反操作技巧
Python scrapy爬取起点中文网小说榜单
You might like
windows8.1下Apache+Php+MySQL配置步骤
2015/10/30 PHP
PHP中Array相关函数简介
2016/07/03 PHP
Ajax+PHP实现的分类列表框功能示例
2019/02/11 PHP
Yii使用DbTarget实现日志功能的示例代码
2020/07/21 PHP
用js计算页面执行时间的函数
2006/12/07 Javascript
Javascript SHA-1:Secure Hash Algorithm
2006/12/20 Javascript
JQuery与JSon实现的无刷新分页代码
2011/09/13 Javascript
JQuery 常用方法和事件详细介绍
2013/04/18 Javascript
仿谷歌主页js动画效果实现代码
2013/07/14 Javascript
angularjs的一些优化小技巧
2014/12/06 Javascript
js实现根据身份证号自动生成出生日期
2015/12/15 Javascript
非常棒的jQuery图片轮播效果
2016/04/17 Javascript
学习JS中的DOM节点以及操作
2018/04/30 Javascript
微信小程序中上传图片并进行压缩的实现代码
2018/08/28 Javascript
vue中tab选项卡的实现思路
2018/11/25 Javascript
Vue.js+cube-ui(Scroll组件)实现类似头条效果的横向滚动导航条
2019/06/24 Javascript
JavaScript如何获取一个元素的样式信息
2019/07/29 Javascript
微信小程序 搜索框组件代码实例
2019/09/06 Javascript
python中将阿拉伯数字转换成中文的实现代码
2011/05/19 Python
简洁的十分钟Python入门教程
2015/04/03 Python
python 打印出所有的对象/模块的属性(实例代码)
2016/09/11 Python
python中Pycharm 输出中文或打印中文乱码现象的解决办法
2017/06/16 Python
python微信跳一跳系列之色块轮廓定位棋盘
2018/02/26 Python
浅谈python正则的常用方法 覆盖范围70%以上
2018/03/14 Python
python模块smtplib学习
2018/05/22 Python
python查询文件夹下excel的sheet名代码实例
2019/04/02 Python
python django框架中使用FastDFS分布式文件系统的安装方法
2019/06/10 Python
浅谈python中统计计数的几种方法和Counter详解
2019/11/07 Python
Expedia泰国:预订机票、酒店和旅游包(航班+酒店)
2016/09/27 全球购物
标准化管理实施方案
2014/02/25 职场文书
公共场所禁烟标语
2014/06/25 职场文书
入党政审材料范文
2014/12/24 职场文书
明星邀请函
2015/02/02 职场文书
出国留学单位推荐信
2015/03/26 职场文书
小学教师师德师风承诺书
2015/04/28 职场文书
vue+element ui实现锚点定位
2021/06/29 Vue.js