用Python爬取某乎手机APP数据


Posted in Python onJune 15, 2021

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

到此这篇关于用Python爬取某乎手机APP数据的文章就介绍到这了,更多相关Python爬取APP数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python 字符串split的用法分享
Mar 23 Python
python单线程实现多个定时器示例
Mar 30 Python
python实现rest请求api示例
Apr 22 Python
Centos5.x下升级python到python2.7版本教程
Feb 14 Python
python中dict字典的查询键值对 遍历 排序 创建 访问 更新 删除基础操作方法
Sep 13 Python
python3读取图片并灰度化图片的四种方法(OpenCV、PIL.Image、TensorFlow方法)总结
Jul 04 Python
Tkinter中复选菜单是否被选中的判断与设置方式
Mar 04 Python
django修改models重建数据库的操作
Mar 31 Python
简单的命令查看安装的python版本号
Aug 28 Python
python中not、and和or的优先级与详细用法介绍
Nov 03 Python
PyCharm 安装与使用配置教程(windows,mac通用)
May 12 Python
Python爬虫基础之爬虫的分类知识总结
May 13 Python
七个非常实用的Python工具包总结
python异常中else的实例用法
Jun 15 #Python
Python实现简单的猜单词
Python自动化爬取天眼查数据的实现
浅谈Python响应式类库RxPy
Jun 14 #Python
Python Django ORM连表正反操作技巧
Python scrapy爬取起点中文网小说榜单
You might like
使用php验证复选框有效性的示例
2013/11/13 PHP
android上传图片到PHP的过程详解
2015/08/03 PHP
利用php-cli和任务计划实现刷新token功能的方法
2017/05/03 PHP
PHP获取二叉树镜像的方法
2018/01/17 PHP
Js 获取当前日期时间及其它操作实现代码
2021/03/04 Javascript
IE下使用cloneNode注意事项分享
2012/11/22 Javascript
JavaScript函数的4种调用方法详解
2014/04/22 Javascript
使用jQuery重置(reset)表单的方法
2014/05/05 Javascript
javascript基础语法学习笔记
2016/01/04 Javascript
jQuery实现简单滚动动画效果
2016/04/07 Javascript
JQuery 两种方法解决刚创建的元素遍历不到的问题
2016/04/13 Javascript
Node.js Streams文件读写操作详解
2016/07/04 Javascript
canvas实现钟表效果
2017/02/13 Javascript
Js中使用正则表达式验证输入是否有特殊字符
2018/09/07 Javascript
Vue 后台管理类项目兼容IE9+的方法示例
2019/02/20 Javascript
[49:43]VG vs FNATIC 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/17 DOTA
[50:02]完美世界DOTA2联赛PWL S2 Magma vs FTD 第三场 11.29
2020/12/03 DOTA
Python采用socket模拟TCP通讯的实现方法
2014/11/19 Python
Python中使用PIPE操作Linux管道
2015/02/04 Python
Python实现简单多线程任务队列
2016/02/27 Python
python 安装virtualenv和virtualenvwrapper的方法
2017/01/13 Python
python 3.6 tkinter+urllib+json实现火车车次信息查询功能
2017/12/20 Python
Python实现繁?转为简体的方法示例
2018/12/18 Python
Python通过paramiko远程下载Linux服务器上的文件实例
2018/12/27 Python
Python @property使用方法解析
2019/09/17 Python
Pandas数据离散化原理及实例解析
2019/11/16 Python
马来西亚综合购物网站:Lazada马来西亚
2018/06/05 全球购物
时尚圣经:The Fashion Bible
2019/03/03 全球购物
Linux内核的同步机制是什么?主要有哪几种内核锁
2016/07/11 面试题
教师研修随笔感言
2014/01/23 职场文书
2014教师研修学习体会
2014/07/08 职场文书
“四风”问题自我剖析材料思想汇报
2014/09/23 职场文书
民主评议党员总结
2014/10/20 职场文书
工程进度款催款函
2015/06/24 职场文书
关于党风廉政建设宣传教育月的活动总结!
2019/08/08 职场文书
SQL Server2019安装的详细步骤实战记录(亲测可用)
2022/06/10 SQL Server