用Python爬取某乎手机APP数据


Posted in Python onJune 15, 2021

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

到此这篇关于用Python爬取某乎手机APP数据的文章就介绍到这了,更多相关Python爬取APP数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python使用爬虫猜密码
Feb 19 Python
Linux 发邮件磁盘空间监控(python)
Apr 23 Python
Python中enumerate()函数编写更Pythonic的循环
Mar 06 Python
Python 如何优雅的将数字转化为时间格式的方法
Sep 26 Python
Python 迭代,for...in遍历,迭代原理与应用示例
Oct 12 Python
flask 实现token机制的示例代码
Nov 07 Python
python GUI库图形界面开发之PyQt5窗口控件QWidget详细使用方法
Feb 26 Python
pyMySQL SQL语句传参问题,单个参数或多个参数说明
Jun 06 Python
如何使用pycharm连接Databricks的步骤详解
Sep 23 Python
Jupyter Notebook安装及使用方法解析
Nov 12 Python
python 用opencv实现图像修复和图像金字塔
Nov 27 Python
用python批量下载apk
Dec 29 Python
七个非常实用的Python工具包总结
python异常中else的实例用法
Jun 15 #Python
Python实现简单的猜单词
Python自动化爬取天眼查数据的实现
浅谈Python响应式类库RxPy
Jun 14 #Python
Python Django ORM连表正反操作技巧
Python scrapy爬取起点中文网小说榜单
You might like
PHP 5昨天隆重推出--PHP 5/Zend Engine 2.0新特性
2006/10/09 PHP
PHP编程实现计算抽奖概率算法完整实例
2017/08/09 PHP
javascript编程起步(第三课)
2007/02/27 Javascript
JQuery下的Live方法和$.browser方法使用代码
2010/06/02 Javascript
基于dropdown.js实现的两款美观大气的二级导航菜单
2015/09/02 Javascript
jQuery实现的跨容器无缝拖动效果代码
2016/06/21 Javascript
JavaScript实现前端实时搜索功能
2020/03/26 Javascript
vue定义全局变量和全局方法的方法示例
2018/08/01 Javascript
vue同步父子组件和异步父子组件的生命周期顺序问题
2018/10/07 Javascript
小程序中this.setData的使用和注意事项
2019/08/28 Javascript
layui关闭弹窗后刷新主页面和当前更改项的例子
2019/09/06 Javascript
在微信小程序中渲染HTML内容3种解决方案及分析与问题解决
2020/01/12 Javascript
vue子组件改变父组件传递的prop值通过sync实现数据双向绑定(DEMO)
2020/02/01 Javascript
JS前端广告拦截实现原理解析
2020/02/17 Javascript
[46:02]DOTA2上海特级锦标赛D组资格赛#2 Liquid VS VP第二局
2016/02/28 DOTA
跟老齐学Python之有点简约的元组
2014/09/24 Python
Python中optparse模块使用浅析
2015/01/01 Python
Python中有趣在__call__函数
2015/06/21 Python
python实现外卖信息管理系统
2018/01/11 Python
Python编程flask使用页面模版的方法
2018/12/28 Python
python多任务及返回值的处理方法
2019/01/22 Python
Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)
2019/06/28 Python
python的re模块使用方法详解
2019/07/26 Python
python爬虫-模拟微博登录功能
2019/09/12 Python
python多线程并发及测试框架案例
2019/10/15 Python
基于python的itchat库实现微信聊天机器人(推荐)
2019/10/29 Python
如何分离django中的媒体、静态文件和网页
2019/11/12 Python
Python版中国省市经纬度
2020/02/11 Python
django ObjectDoesNotExist 和 DoesNotExist的用法
2020/07/09 Python
Pycharm自动添加文件头注释和函数注释参数的方法
2020/10/23 Python
架构师岗位职责
2013/11/18 职场文书
中学家长会邀请函
2014/01/17 职场文书
有关骆驼祥子的读书笔记
2015/06/26 职场文书
入党心得体会
2019/06/20 职场文书
UNION CREATIVE《Re:从零开始的异世界生活》雷姆手办
2022/03/20 日漫
python中 Flask Web 表单的使用方法
2022/05/20 Python