python实现爱奇艺登陆密码RSA加密的方法示例详解


Posted in Python onMay 27, 2020

前言

通过Python实现对大麦网近期全国演唱会数据进行爬取,通过分析,我们发现大麦网属于Python爬虫策略中“中等型”难度网站,演唱会数据封装在json文件中。因此,我们简单的通过requests、json就可以将数据爬取出来,后期通过pandas进行数据筛选并保存至Excel文件中。

1.目标网站分析

python实现爱奇艺登陆密码RSA加密的方法示例详解

检查一下看xhr中有没有我们需要的数据。

python实现爱奇艺登陆密码RSA加密的方法示例详解

python实现爱奇艺登陆密码RSA加密的方法示例详解

很好,就在xhr中用json封装了数据。

2.构造相应的Request URL

python实现爱奇艺登陆密码RSA加密的方法示例详解

python实现爱奇艺登陆密码RSA加密的方法示例详解

request url中只有一个参数变化,那就是“Page=”这个选项变了,简单了?,一共6页,直接循环构造了。

python实现爱奇艺登陆密码RSA加密的方法示例详解

for i in range(1,7):
 url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn='
# print(url)

3.requests爬虫走起

直接上代码:

def crawl(url): 
 headers={
 'cookie': 'cna=J7K2Fok5AXECARu7QWn6+cxu; isg=BCcnDiP-NfKV5bF-OctWuXuatl3xrPuOyBVJJfmQLrZn6ESqAX0y3jrhCuj2ANMG; l=eBSmWoPRQeT6Zn3iBO5whurza77O1CAf1sPzaNbMiIncC6BR1AvOCJxQLtyCvptRR8XcGLLB4nU7C5eTae7_7CDmndLHuI50MbkyCef..',
 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
 }
 response=requests.get(url,headers=headers)
 json_text=json.loads(response.text)
 # print(json_text.keys())
 rdata=json_text['pageData']['resultData']
 # print(rdata)
 return(rdata)

加一个headers,简单做一个防反爬。

4.保存至excel文件

基本思路是将每页数据保存成pandas的DataFrame结构,然后进行拼接,拼接完后再保存到Excel文件中。

inidata=pd.DataFrame(columns=('name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic'))
for i in range(1,7):
 url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn='
 # print(url)
 # print(crawl(url))
 data=pd.DataFrame(crawl(url))
 data1=data[['name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic']]
 inidata=inidata.append(data1)
# print(inidata)
inidata.to_excel('大麦网演唱会.xlsx',index=0)

5.看看效果

python实现爱奇艺登陆密码RSA加密的方法示例详解

总结

到此这篇关于python实现爱奇艺登陆的密码RSA加密的文章就介绍到这了,更多相关python实现爱奇艺登陆的密码RSA加密内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python实现巡检系统(solaris)示例
Apr 02 Python
python调用Moxa PCOMM Lite通过串口Ymodem协议实现发送文件
Aug 15 Python
使用Python编写vim插件的简单示例
Apr 17 Python
python实现unicode转中文及转换默认编码的方法
Apr 29 Python
浅谈Python实现Apriori算法介绍
Dec 20 Python
详解python爬虫系列之初识爬虫
Apr 06 Python
Python学习笔记之迭代器和生成器用法实例详解
Aug 08 Python
利用python实现PSO算法优化二元函数
Nov 13 Python
python 解决flask 图片在线浏览或者直接下载的问题
Jan 09 Python
Pycharm远程连接服务器并实现代码同步上传更新功能
Feb 25 Python
python GUI库图形界面开发之PyQt5 Qt Designer工具(Qt设计师)详细使用方法及Designer ui文件转py文件方法
Feb 26 Python
python面向对象版学生信息管理系统
Jun 24 Python
python如何求100以内的素数
May 27 #Python
pytorch查看通道数 维数 尺寸大小方式
May 26 #Python
Pytorch 使用 nii数据做输入数据的操作
May 26 #Python
python变量的作用域是什么
May 26 #Python
Python3 pywin32模块安装的详细步骤
May 26 #Python
什么是python的列表推导式
May 26 #Python
python中列表的含义及用法
May 26 #Python
You might like
一个数据采集类
2007/02/14 PHP
用PHP将网址字符串转换成超链接(网址或email)
2010/05/25 PHP
php批量更改数据库表前缀实现方法
2013/10/26 PHP
PHP书写格式详解(必看)
2016/05/23 PHP
laravel批量生成假数据的方法
2019/10/09 PHP
向大师们学习Javascript(视频与PPT)
2009/12/27 Javascript
JavaScript 对象的属性和方法4种不同的类型
2010/03/19 Javascript
jQuery之end()和pushStack()使用介绍
2012/02/07 Javascript
JS+CSS实现一个气泡提示框
2013/08/18 Javascript
JS实现根据当前文字选择返回被选中的文字
2014/05/21 Javascript
深入分析JQuery和JavaScript的异同
2014/10/23 Javascript
jquery判断单选按钮radio是否选中的方法
2015/05/05 Javascript
代码分析jQuery四种静态方法使用
2015/07/23 Javascript
jquery+css实现绚丽的横向二级下拉菜单-附源码下载
2015/08/23 Javascript
JavaScript电子时钟倒计时
2016/01/09 Javascript
一次$.getJSON不执行的简单记录
2016/07/19 Javascript
深入理解JS DOM事件机制
2016/08/06 Javascript
bootstrap使用validate实现简单校验功能
2016/12/02 Javascript
使用vue-cli编写vue插件的方法
2018/02/26 Javascript
vue树形结构获取键值的方法示例
2018/06/21 Javascript
移动端手指操控左右滑动的菜单
2019/09/08 Javascript
用Node写一条配置环境的指令
2019/11/14 Javascript
基于canvas实现手写签名(vue)
2020/05/21 Javascript
python网络编程之读取网站根目录实例
2014/09/30 Python
基于numpy中数组元素的切片复制方法
2018/11/15 Python
python广度优先搜索得到两点间最短路径
2019/01/17 Python
Django时区详解
2019/07/24 Python
python字典的setdefault的巧妙用法
2019/08/07 Python
Html5移动端获奖无缝滚动动画实现示例
2018/06/25 HTML / CSS
详解canvas绘制网络字体几种方法
2019/08/27 HTML / CSS
June Jacobs尊积帕官网:知名的spa水疗护肤品牌
2019/03/21 全球购物
北京青年观后感
2015/06/15 职场文书
python实现简单的名片管理系统
2021/04/26 Python
python控制台打印log输出重复的解决方法
2021/05/14 Python
Java常用函数式接口总结
2021/06/29 Java/Android
Golang解析JSON对象
2022/04/30 Golang