用Python爬取某乎手机APP数据


Posted in Python onJune 15, 2021

一、配置抓包工具

1.安装软件

本文选择的抓包工具:Fiddler  

具体的下载安装这里不详细赘述!(网上搜Fiddler安装,一大堆教程),本文以实战为例,就不再这里浪费时间了!

2.配置Fiddler

安装好之后,接下来就开始配置Fiddler工具(这里是关键,仔细阅读!

配置Connections

打开Fiddler后,点击Tools->Options

用Python爬取某乎手机APP数据

点击Connections

用Python爬取某乎手机APP数据

勾选上对应的选项

配置HTTPS

由于目前大部分APP都是https加密,包括本文实战『某乎』案例也是https加密,因此配置HTTPS,来抓取https数据包!

用Python爬取某乎手机APP数据

勾选上对应的选项

最后抓包工具Fiddler就配置好了

记得重启Fiddler重启Fiddler重启Fiddler!不然可能不生效

二、配置手机代理

 1.设置代理

准备工作

首先看一下安装Fiddler主机ip(电脑和手机必须处于同一局域网

查看ip命令

window:ipconfig

用Python爬取某乎手机APP数据

开始配置

目标代理主机信息
ip:192.168.31.195

端口:8888

在wifi无线网处进去,点击配置代理

填写好相关代理信息

用Python爬取某乎手机APP数据

2.安装证书

在浏览器输入:

http://192.168.31.195:8888

用Python爬取某乎手机APP数据

点击下载证书后,下面就开始安装(看图操作

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

用Python爬取某乎手机APP数据

ok,这样手机端就配置完成,下面开始抓取数据!!!

三、抓取数据

1.打开某乎app

用Python爬取某乎手机APP数据

2.查看数据包列表

打开app之后,Fiddler就已经抓取到数据了

用Python爬取某乎手机APP数据

这里可以看到app发送和接收了哪些数据包

为了更加精准定位到某乎(只看目标的数据包),添加一个过滤条件

用Python爬取某乎手机APP数据

这样我们获取的数据包列表就都是过滤条件内的目标网址

用Python爬取某乎手机APP数据

3.查找数据包

比如点击热榜

用Python爬取某乎手机APP数据

对应的https加密数据包如下:

用Python爬取某乎手机APP数据

数据包中的数据如下:

用Python爬取某乎手机APP数据

提取出url链接

用Python爬取某乎手机APP数据

https://api.zhihu.com/topstory/hot-list?limit=10&reverse_order=0

拿到url之后,接着开始编程爬取保存数据。

4.编写爬虫程序

# -*- coding: utf-8 -*-

用Python爬取某乎手机APP数据

ok这样就可以将数据获取下来!

四、总结

1.配置抓包工具Fiddler(重点)。

2.ios苹果手机配置证书和设置代理(安卓手机也类似)。

3.简单使用Fiddler(过滤数据包、查看数据包等)。

4.本文以某乎为实战,实现了python爬取手机app数据

到此这篇关于用Python爬取某乎手机APP数据的文章就介绍到这了,更多相关Python爬取APP数据内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python创建一个最简单http webserver服务器的方法
May 08 Python
浅谈python多线程和队列管理shell程序
Aug 04 Python
使用Mixin设计模式进行Python编程的方法讲解
Jun 21 Python
Python 专题四 文件基础知识
Mar 20 Python
使用Python对Access读写操作
Mar 30 Python
详解python使用Nginx和uWSGI来运行Python应用
Jan 09 Python
selenium python浏览器多窗口处理代码示例
Jan 15 Python
儿童python练习实例
May 27 Python
Python判断以什么结尾以什么开头的实例
Oct 27 Python
利用django+wechat-python-sdk 创建微信服务器接入的方法
Feb 20 Python
python中的 zip函数详解及用法举例
Feb 16 Python
详解python爬取弹幕与数据分析
Nov 14 Python
七个非常实用的Python工具包总结
python异常中else的实例用法
Jun 15 #Python
Python实现简单的猜单词
Python自动化爬取天眼查数据的实现
浅谈Python响应式类库RxPy
Jun 14 #Python
Python Django ORM连表正反操作技巧
Python scrapy爬取起点中文网小说榜单
You might like
浅析关于PHP位运算的简单权限设计
2013/06/30 PHP
php如何连接sql server
2015/10/16 PHP
10个值得深思的PHP面试题
2016/11/14 PHP
jquery的Tooltip插件 qtip使用详细说明
2010/09/08 Javascript
一些有用的JavaScript和jQuery的片段分享
2011/08/23 Javascript
原生Javascript封装的一个AJAX函数分享
2014/10/11 Javascript
《JavaScript DOM 编程艺术》读书笔记之JavaScript 简史
2015/01/09 Javascript
javascript基本包装类型介绍
2015/04/10 Javascript
AngularJS使用ngOption实现下拉列表的实例代码
2016/01/23 Javascript
基于js对象,操作属性、方法详解
2016/08/11 Javascript
jsp 网站引入外部css或者js失效问题解决
2016/10/31 Javascript
leaflet的开发入门教程
2016/11/17 Javascript
JS实现含有中文字符串的友好截取功能分析
2017/03/13 Javascript
微信小程序实现日历效果
2018/12/28 Javascript
微信小程序template模板与component组件的区别和使用详解
2019/05/22 Javascript
layui prompt 设置允许空白提交的方法
2019/09/24 Javascript
使用 Jest 和 Supertest 进行接口端点测试实例详解
2020/04/25 Javascript
python写的ARP攻击代码实例
2014/06/04 Python
详解Python的Django框架中的中间件
2015/07/24 Python
Python解决八皇后问题示例
2018/04/22 Python
wtfPython—Python中一组有趣微妙的代码【收藏】
2018/08/31 Python
Python高级特性与几种函数的讲解
2019/03/08 Python
python适合人工智能的理由和优势
2019/06/28 Python
对Python3中列表乘以某一个数的示例详解
2019/07/20 Python
Python Opencv中用compareHist函数进行直方图比较对比图片
2020/04/07 Python
Pycharm IDE的安装和使用教程详解
2020/04/30 Python
Django自带用户认证系统使用方法解析
2020/11/12 Python
HTML5混合开发二维码扫描以及调用本地摄像头
2017/12/27 HTML / CSS
房屋租赁委托书范本
2014/10/04 职场文书
工程安全生产协议书
2014/11/21 职场文书
2014年妇幼保健工作总结
2014/12/08 职场文书
2015年检察院个人工作总结
2015/05/20 职场文书
2015医院个人工作总结范文
2015/05/21 职场文书
担保书怎么写 ?
2019/04/22 职场文书
基于HTML十秒做出淘宝页面
2021/10/24 HTML / CSS
Java实现HTML转为Word的示例代码
2022/06/28 Java/Android