python实现爱奇艺登陆密码RSA加密的方法示例详解


Posted in Python onMay 27, 2020

前言

通过Python实现对大麦网近期全国演唱会数据进行爬取,通过分析,我们发现大麦网属于Python爬虫策略中“中等型”难度网站,演唱会数据封装在json文件中。因此,我们简单的通过requests、json就可以将数据爬取出来,后期通过pandas进行数据筛选并保存至Excel文件中。

1.目标网站分析

python实现爱奇艺登陆密码RSA加密的方法示例详解

检查一下看xhr中有没有我们需要的数据。

python实现爱奇艺登陆密码RSA加密的方法示例详解

python实现爱奇艺登陆密码RSA加密的方法示例详解

很好,就在xhr中用json封装了数据。

2.构造相应的Request URL

python实现爱奇艺登陆密码RSA加密的方法示例详解

python实现爱奇艺登陆密码RSA加密的方法示例详解

request url中只有一个参数变化,那就是“Page=”这个选项变了,简单了?,一共6页,直接循环构造了。

python实现爱奇艺登陆密码RSA加密的方法示例详解

for i in range(1,7):
 url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn='
# print(url)

3.requests爬虫走起

直接上代码:

def crawl(url): 
 headers={
 'cookie': 'cna=J7K2Fok5AXECARu7QWn6+cxu; isg=BCcnDiP-NfKV5bF-OctWuXuatl3xrPuOyBVJJfmQLrZn6ESqAX0y3jrhCuj2ANMG; l=eBSmWoPRQeT6Zn3iBO5whurza77O1CAf1sPzaNbMiIncC6BR1AvOCJxQLtyCvptRR8XcGLLB4nU7C5eTae7_7CDmndLHuI50MbkyCef..',
 'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
 }
 response=requests.get(url,headers=headers)
 json_text=json.loads(response.text)
 # print(json_text.keys())
 rdata=json_text['pageData']['resultData']
 # print(rdata)
 return(rdata)

加一个headers,简单做一个防反爬。

4.保存至excel文件

基本思路是将每页数据保存成pandas的DataFrame结构,然后进行拼接,拼接完后再保存到Excel文件中。

inidata=pd.DataFrame(columns=('name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic'))
for i in range(1,7):
 url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn='
 # print(url)
 # print(crawl(url))
 data=pd.DataFrame(crawl(url))
 data1=data[['name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic']]
 inidata=inidata.append(data1)
# print(inidata)
inidata.to_excel('大麦网演唱会.xlsx',index=0)

5.看看效果

python实现爱奇艺登陆密码RSA加密的方法示例详解

总结

到此这篇关于python实现爱奇艺登陆的密码RSA加密的文章就介绍到这了,更多相关python实现爱奇艺登陆的密码RSA加密内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实用日期时间处理方法汇总
May 09 Python
详解python3百度指数抓取实例
Dec 12 Python
Python基于jieba库进行简单分词及词云功能实现方法
Jun 16 Python
Django配置celery(非djcelery)执行异步任务和定时任务
Jul 16 Python
详解python实现数据归一化处理的方式:(0,1)标准化
Jul 17 Python
python递归法实现简易连连看小游戏
Mar 25 Python
OpenCV里的imshow()和Matplotlib.pyplot的imshow()的实现
Nov 25 Python
Python函数式编程实例详解
Jan 17 Python
在tensorflow中实现去除不足一个batch的数据
Jan 20 Python
python实现坦克大战
Apr 24 Python
Django form表单与请求的生命周期步骤详解
Jun 07 Python
pytorch 实现在测试的时候启用dropout
May 27 Python
python如何求100以内的素数
May 27 #Python
pytorch查看通道数 维数 尺寸大小方式
May 26 #Python
Pytorch 使用 nii数据做输入数据的操作
May 26 #Python
python变量的作用域是什么
May 26 #Python
Python3 pywin32模块安装的详细步骤
May 26 #Python
什么是python的列表推导式
May 26 #Python
python中列表的含义及用法
May 26 #Python
You might like
PHP 开发工具
2006/12/06 PHP
一个加载js文件的小脚本
2007/06/28 Javascript
jQuery版Tab标签切换
2011/03/16 Javascript
jquery maxlength使用说明
2011/09/09 Javascript
JQuery实现简单时尚快捷的气泡提示插件
2012/12/20 Javascript
js网页中的(运行代码)功能实现思路
2013/02/04 Javascript
jQuery动态添加删除select项(实现代码)
2013/09/03 Javascript
js对列表中第一个值处理与jsp页面对列表中第一个值处理的区别详解
2013/11/05 Javascript
js贪吃蛇网页版游戏特效代码分享(挑战十关)
2015/08/24 Javascript
JS+CSS实现仿雅虎另类滑动门切换效果
2015/10/13 Javascript
js创建数组的简单方法
2016/07/27 Javascript
详解NodeJS框架express的路径映射(路由)功能及控制
2017/03/24 NodeJs
Angular.js中window.onload(),$(document).ready()的写法浅析
2017/09/28 Javascript
jQuery实现的鼠标滚轮控制图片缩放功能实例
2017/10/14 jQuery
Vue+Mock.js模拟登录和表格的增删改查功能
2018/07/26 Javascript
使用Node搭建reactSSR服务端渲染架构
2018/08/30 Javascript
对angularJs中$sce服务安全显示html文本的实例
2018/09/30 Javascript
vue页面切换过渡transition效果
2018/10/08 Javascript
详解JavaScript的变量
2019/04/04 Javascript
基于jquery ajax的多文件上传进度条过程解析
2019/09/11 jQuery
es6函数之尾调用优化实例分析
2020/04/25 Javascript
js实现右键弹出自定义菜单
2020/09/08 Javascript
[02:42]完美大师赛主赛事淘汰赛第三日观众采访
2017/11/25 DOTA
python映射列表实例分析
2015/01/26 Python
python读取excel指定列数据并写入到新的excel方法
2018/07/10 Python
python调用外部程序的实操步骤
2019/03/04 Python
python禁用键鼠与提权代码实例
2019/08/16 Python
python实现多线程端口扫描
2019/08/31 Python
Python实现迪杰斯特拉算法并生成最短路径的示例代码
2020/12/01 Python
带你认识HTML5中的WebSocket
2015/05/22 HTML / CSS
阿姆斯特丹城市卡:Amsterdam Pass
2019/12/01 全球购物
优秀教师先进个人事迹材料
2014/08/31 职场文书
2014年妇女工作总结
2014/12/06 职场文书
2016年国陪研修感言
2015/11/18 职场文书
tomcat的catalina.out日志按自定义时间格式进行分割的操作方法
2022/04/02 Servers
Windows server 2012搭建FTP服务器
2022/04/29 Servers