python使用beautifulsoup4爬取酷狗音乐代码实例


Posted in Python onDecember 04, 2019

这篇文章主要介绍了python使用beautifulsoup4爬取酷狗音乐代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

小编经常在网上听一些音乐但是有一些网站好多音乐都是付费下载的正好我会点爬虫技术,空闲时间写了一份,截止4月底没有问题的,会下载到当前目录,只要按照bs4库就好,

安装方法:pip install beautifulsoup4

完整代码如下:双击就能直接运行

from bs4 import BeautifulSoup
import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'
}
url='https://songsearch.kugou.com/song_search_v2?&page=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_filter=0&_=1555124510574'
#想要爬取别的网页直接修改这个json数据地址就行
r=requests.get(url,headers=headers)
soup=BeautifulSoup(r.text,'lxml')
title_list=soup.select('.pc_temp_songlist ul li')
hash=re.findall(r',"FileHash":"(.*?)"',r.text)
hash1=re.findall(r',"FileName":"(.*?)"',r.text)
#直接用正则匹配隐藏的数据
print(hash)
print(hash1)
q=0
for url in hash:
url_a=f'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery1910212680783679835_1555073815772&hash={url}&album_id=18784389'
#这个URL不用修改的
c=requests.get(url_a,headers=headers)
a=c.text[40:-3]
b=re.findall('"play_url":"(.*)","authors":',a)[0]
b1=re.sub(r"\\",'',b)
f = requests.get(b1)
with open(hash1[q]+'.mp3','wb')as d:
d.write(f.content)
print(hash1[q])
q+=1

爬取酷狗的唯一难点就是hash值的获取找了一个多小时才找到,比网易云好点就是自己不用写一个哈希值,酷狗是自己就存在的能找到,网易云是需要函数生成的。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中查找excel某一列的重复数据 剔除之后打印
Feb 10 Python
Centos Python2 升级到Python3的简单实现
Jun 21 Python
Python文件操作基本流程代码实例
Dec 11 Python
python模拟表单提交登录图书馆
Apr 27 Python
通过pykafka接收Kafka消息队列的方法
Dec 27 Python
使用python进行波形及频谱绘制的方法
Jun 17 Python
python识别图像并提取文字的实现方法
Jun 28 Python
python 将日期戳(五位数时间)转换为标准时间
Jul 11 Python
Python中的延迟绑定原理详解
Oct 11 Python
Python调用shell命令常用方法(4种)
May 11 Python
Python 按比例获取样本数据或执行任务的实现代码
Dec 03 Python
分享PyCharm最新激活码(真永久激活方法)不用每月找安装参数或最新激活码了
Dec 27 Python
python3中numpy函数tile的用法详解
Dec 04 #Python
python 实现目录复制的三种小结
Dec 04 #Python
python求绝对值的三种方法小结
Dec 04 #Python
解决Python3下map函数的显示问题
Dec 04 #Python
Django3.0 异步通信初体验(小结)
Dec 04 #Python
在OpenCV里实现条码区域识别的方法示例
Dec 04 #Python
Python绘图实现显示中文
Dec 04 #Python
You might like
php检测文件编码的方法示例
2014/04/25 PHP
PDO操作MySQL的基础教程(推荐)
2017/08/18 PHP
js中将多个语句写成一个语句的两种方法小结
2007/12/08 Javascript
Jquery使用Firefox FireBug插件调试Ajax步骤讲解
2013/12/02 Javascript
js强制把网址设为默认首页
2015/09/29 Javascript
有趣的bootstrap走动进度条
2016/12/01 Javascript
微信小程序 弹幕功能简单实例
2017/02/14 Javascript
jQuery实现链接的title快速出现的方法
2017/02/20 Javascript
bootstrap table动态加载数据示例代码
2017/03/25 Javascript
Vue学习笔记进阶篇之多元素及多组件过渡
2017/07/19 Javascript
vue利用better-scroll实现轮播图与页面滚动详解
2017/10/20 Javascript
JS运动特效之链式运动分析
2018/01/24 Javascript
vue使用el-upload上传文件及Feign服务间传递文件的方法
2019/03/15 Javascript
使用eslint和githooks统一前端风格的技巧
2020/07/29 Javascript
[59:30]VG vs LGD 2019国际邀请赛淘汰赛 胜者组 BO3 第二场 8.22
2019/09/05 DOTA
比较详细Python正则表达式操作指南(re使用)
2008/09/06 Python
Python基于list的append和pop方法实现堆栈与队列功能示例
2017/07/24 Python
python使用tensorflow深度学习识别验证码
2018/04/03 Python
Python转换时间的图文方法
2019/07/01 Python
python聚类算法解决方案(rest接口/mpp数据库/json数据/下载图片及数据)
2019/08/28 Python
Python 3.6打包成EXE可执行程序的实现
2019/10/18 Python
Python队列、进程间通信、线程案例
2019/10/25 Python
PyCharm下载和安装详细步骤
2019/12/17 Python
Tensorflow与Keras自适应使用显存方式
2020/06/22 Python
重构Python代码的六个实例
2020/11/25 Python
python help函数实例用法
2020/12/06 Python
详解CSS3中Media Queries的相关使用
2015/07/17 HTML / CSS
NFL Game Pass欧洲:在线观看NFL比赛直播和点播,以高清质量播放
2018/08/30 全球购物
公司周年庆典邀请函
2014/01/12 职场文书
求职毕业生自荐书
2014/02/08 职场文书
转让协议书范本
2014/09/13 职场文书
护士个人总结范文
2015/02/13 职场文书
2015年感恩父亲节演讲稿
2015/03/19 职场文书
税务会计岗位职责
2015/04/02 职场文书
MySQL sql_mode的使用详解
2021/05/08 MySQL
python中pymysql包操作数据库方法
2022/04/19 Python