python使用beautifulsoup4爬取酷狗音乐代码实例


Posted in Python onDecember 04, 2019

这篇文章主要介绍了python使用beautifulsoup4爬取酷狗音乐代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

小编经常在网上听一些音乐但是有一些网站好多音乐都是付费下载的正好我会点爬虫技术,空闲时间写了一份,截止4月底没有问题的,会下载到当前目录,只要按照bs4库就好,

安装方法:pip install beautifulsoup4

完整代码如下:双击就能直接运行

from bs4 import BeautifulSoup
import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'
}
url='https://songsearch.kugou.com/song_search_v2?&page=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_filter=0&_=1555124510574'
#想要爬取别的网页直接修改这个json数据地址就行
r=requests.get(url,headers=headers)
soup=BeautifulSoup(r.text,'lxml')
title_list=soup.select('.pc_temp_songlist ul li')
hash=re.findall(r',"FileHash":"(.*?)"',r.text)
hash1=re.findall(r',"FileName":"(.*?)"',r.text)
#直接用正则匹配隐藏的数据
print(hash)
print(hash1)
q=0
for url in hash:
url_a=f'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery1910212680783679835_1555073815772&hash={url}&album_id=18784389'
#这个URL不用修改的
c=requests.get(url_a,headers=headers)
a=c.text[40:-3]
b=re.findall('"play_url":"(.*)","authors":',a)[0]
b1=re.sub(r"\\",'',b)
f = requests.get(b1)
with open(hash1[q]+'.mp3','wb')as d:
d.write(f.content)
print(hash1[q])
q+=1

爬取酷狗的唯一难点就是hash值的获取找了一个多小时才找到,比网易云好点就是自己不用写一个哈希值,酷狗是自己就存在的能找到,网易云是需要函数生成的。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python批量重命名同一文件夹下文件的方法
May 25 Python
Python中对象迭代与反迭代的技巧总结
Sep 17 Python
使用Python多线程爬虫爬取电影天堂资源
Sep 23 Python
python selenium登录豆瓣网过程解析
Aug 10 Python
基于keras 模型、结构、权重保存的实现
Jan 24 Python
Python使用QQ邮箱发送邮件实例与QQ邮箱设置详解
Feb 18 Python
Django ModelForm操作及验证方式
Mar 30 Python
PageFactory设计模式基于python实现
Apr 14 Python
python判断正负数方式
Jun 03 Python
python让函数不返回结果的方法
Jun 22 Python
Python3+RIDE+RobotFramework自动化测试框架搭建过程详解
Sep 23 Python
pycharm2021激活码使用教程(永久激活亲测可用)
Mar 30 Python
python3中numpy函数tile的用法详解
Dec 04 #Python
python 实现目录复制的三种小结
Dec 04 #Python
python求绝对值的三种方法小结
Dec 04 #Python
解决Python3下map函数的显示问题
Dec 04 #Python
Django3.0 异步通信初体验(小结)
Dec 04 #Python
在OpenCV里实现条码区域识别的方法示例
Dec 04 #Python
Python绘图实现显示中文
Dec 04 #Python
You might like
让PHP更快的提供文件下载的代码
2012/06/13 PHP
PHP读取数据库并按照中文名称进行排序实现代码
2013/01/29 PHP
php批量添加数据与批量更新数据的实现方法
2014/12/16 PHP
javascript获取鼠标点击元素对象(示例代码)
2013/12/20 Javascript
jQuery插件ajaxFileUpload实现异步上传文件效果
2015/04/14 Javascript
浅谈js数组和splice的用法
2016/12/04 Javascript
JS基于onclick事件实现单个按钮的编辑与保存功能示例
2017/02/13 Javascript
H5上传本地图片并预览功能
2017/05/08 Javascript
详解如何在项目中使用jest测试react native组件
2018/02/09 Javascript
js实现录音上传功能
2019/11/22 Javascript
js实现一款简单踩白块小游戏(曾经很火)
2019/12/02 Javascript
jQuery三组基本动画与自定义动画操作实例总结
2020/05/09 jQuery
使用Mock.js生成前端测试数据
2020/12/13 Javascript
[16:43]Heroes19_剃刀(完美)
2014/10/31 DOTA
[01:32]DOTA2次级联赛——首支职业女子战队选拔赛全记录
2014/10/23 DOTA
使用Python开发windows GUI程序入门实例
2014/10/23 Python
python 全局变量的import机制介绍
2017/09/07 Python
Python数据结构之双向链表的定义与使用方法示例
2018/01/16 Python
每天迁移MySQL历史数据到历史库Python脚本
2018/04/13 Python
python中的decorator的作用详解
2018/07/26 Python
使用python判断你是青少年还是老年人
2018/11/29 Python
python实现K近邻回归,采用等权重和不等权重的方法
2019/01/23 Python
无惧面试,带你搞懂python 装饰器
2020/08/17 Python
Python eval函数原理及用法解析
2020/11/14 Python
selenium设置浏览器为headless无头模式(Chrome和Firefox)
2021/01/08 Python
金牌葡萄酒俱乐部:Gold Medal Wine Club
2017/11/02 全球购物
GANT葡萄牙官方商店:拥有美国运动服传统的生活方式品牌
2018/10/18 全球购物
奢华的意大利皮革手袋:Bene Handbags
2019/10/29 全球购物
汇智创新科技发展有限公司
2015/12/06 面试题
如何利用cmp命令比较文件
2013/09/23 面试题
如何掌握自荐信格式呢
2013/11/19 职场文书
放飞理想演讲稿
2014/09/09 职场文书
大学生入党积极分子自我评价
2014/09/20 职场文书
艺术节开幕词
2015/01/28 职场文书
员工拾金不昧表扬稿
2015/05/05 职场文书
大学入学感言
2015/08/01 职场文书