python使用beautifulsoup4爬取酷狗音乐代码实例


Posted in Python onDecember 04, 2019

这篇文章主要介绍了python使用beautifulsoup4爬取酷狗音乐代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

小编经常在网上听一些音乐但是有一些网站好多音乐都是付费下载的正好我会点爬虫技术,空闲时间写了一份,截止4月底没有问题的,会下载到当前目录,只要按照bs4库就好,

安装方法:pip install beautifulsoup4

完整代码如下:双击就能直接运行

from bs4 import BeautifulSoup
import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'
}
url='https://songsearch.kugou.com/song_search_v2?&page=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_filter=0&_=1555124510574'
#想要爬取别的网页直接修改这个json数据地址就行
r=requests.get(url,headers=headers)
soup=BeautifulSoup(r.text,'lxml')
title_list=soup.select('.pc_temp_songlist ul li')
hash=re.findall(r',"FileHash":"(.*?)"',r.text)
hash1=re.findall(r',"FileName":"(.*?)"',r.text)
#直接用正则匹配隐藏的数据
print(hash)
print(hash1)
q=0
for url in hash:
url_a=f'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery1910212680783679835_1555073815772&hash={url}&album_id=18784389'
#这个URL不用修改的
c=requests.get(url_a,headers=headers)
a=c.text[40:-3]
b=re.findall('"play_url":"(.*)","authors":',a)[0]
b1=re.sub(r"\\",'',b)
f = requests.get(b1)
with open(hash1[q]+'.mp3','wb')as d:
d.write(f.content)
print(hash1[q])
q+=1

爬取酷狗的唯一难点就是hash值的获取找了一个多小时才找到,比网易云好点就是自己不用写一个哈希值,酷狗是自己就存在的能找到,网易云是需要函数生成的。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 数据加密代码
Dec 24 Python
Python输出9*9乘法表的方法
May 25 Python
Python模拟登录验证码(代码简单)
Feb 06 Python
Python实现自动登录百度空间的方法
Jun 10 Python
Python RabbitMQ消息队列实现rpc
May 30 Python
python 提取tuple类型值中json格式的key值方法
Dec 31 Python
django配置连接数据库及原生sql语句的使用方法
Mar 03 Python
Python pandas.DataFrame调整列顺序及修改index名的方法
Jun 21 Python
Django使用Jinja2模板引擎的示例代码
Aug 09 Python
python通过txt文件批量安装依赖包的实现步骤
Aug 13 Python
python3 求约数的实例
Dec 05 Python
在python中实现导入一个需要传参的模块
May 12 Python
python3中numpy函数tile的用法详解
Dec 04 #Python
python 实现目录复制的三种小结
Dec 04 #Python
python求绝对值的三种方法小结
Dec 04 #Python
解决Python3下map函数的显示问题
Dec 04 #Python
Django3.0 异步通信初体验(小结)
Dec 04 #Python
在OpenCV里实现条码区域识别的方法示例
Dec 04 #Python
Python绘图实现显示中文
Dec 04 #Python
You might like
如何在PHP中使用Oracle数据库(6)
2006/10/09 PHP
php中判断文件空目录是否有读写权限的函数代码
2012/08/07 PHP
php设计模式小结
2013/02/15 PHP
php简单复制文件的方法
2016/05/09 PHP
php外部执行命令函数用法小结
2016/10/11 PHP
让你的CSS像Jquery一样做筛选的实现方法
2011/07/10 Javascript
jQuery Mobile的loading对话框显示/隐藏方法分享
2013/11/26 Javascript
Nodejs实现多人同时在线移动鼠标的小游戏分享
2014/12/06 NodeJs
在JavaScript中使用开平方根的sqrt()方法
2015/06/15 Javascript
详解JavaScript时间格式化
2015/12/23 Javascript
AngularJS中的DOM操作用法分析
2016/11/04 Javascript
JavaScript运动框架 解决防抖动问题、悬浮对联(二)
2017/05/17 Javascript
微信小程序使用modal组件弹出对话框功能示例
2017/11/29 Javascript
js动态设置select下拉菜单的默认选中项实例
2018/08/21 Javascript
vant(ZanUi)结合async-validator实现表单验证的方法
2018/12/06 Javascript
JS+canvas画布实现炫酷的旋转星空效果示例
2019/02/13 Javascript
Openlayers实现图形绘制
2020/09/28 Javascript
python修改注册表终止360进程实例
2014/10/13 Python
Python使用functools模块中的partial函数生成偏函数
2016/07/02 Python
Python实现基本数据结构中栈的操作示例
2017/12/04 Python
OpenCV HSV颜色识别及HSV基本颜色分量范围
2019/03/22 Python
Python读取xlsx文件的实现方法
2019/07/04 Python
pandas中DataFrame修改index、columns名的方法示例
2019/08/02 Python
Python的互斥锁与信号量详解
2019/09/12 Python
python rolling regression. 使用 Python 实现滚动回归操作
2020/06/08 Python
python中pyqtgraph知识点总结
2021/01/26 Python
Python tkinter之Bind(绑定事件)的使用示例
2021/02/05 Python
GoPro摄像机美国官网:美国运动相机厂商
2018/07/03 全球购物
同程旅游英文网站:LY.com
2018/11/13 全球购物
员工拾金不昧表扬信
2014/01/09 职场文书
民事诉讼授权委托书范文
2014/08/02 职场文书
给下属加薪申请报告
2015/05/15 职场文书
导盲犬小Q观后感
2015/06/11 职场文书
银行客户经理培训心得体会
2016/01/09 职场文书
《鸡兔同笼》教学反思
2016/02/19 职场文书
JavaScript如何优化逻辑判断代码详解
2021/06/08 Javascript