编程 Python

python使用beautifulsoup4爬取酷狗音乐代码实例

Posted in Python onDecember 04, 2019

这篇文章主要介绍了python使用beautifulsoup4爬取酷狗音乐代码实例,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

小编经常在网上听一些音乐但是有一些网站好多音乐都是付费下载的正好我会点爬虫技术，空闲时间写了一份，截止4月底没有问题的，会下载到当前目录，只要按照bs4库就好，

安装方法：pip install beautifulsoup4

完整代码如下：双击就能直接运行

from bs4 import BeautifulSoup
import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'
}
url='https://songsearch.kugou.com/song_search_v2?&page=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_filter=0&_=1555124510574'
#想要爬取别的网页直接修改这个json数据地址就行
r=requests.get(url,headers=headers)
soup=BeautifulSoup(r.text,'lxml')
title_list=soup.select('.pc_temp_songlist ul li')
hash=re.findall(r',"FileHash":"(.*?)"',r.text)
hash1=re.findall(r',"FileName":"(.*?)"',r.text)
#直接用正则匹配隐藏的数据
print(hash)
print(hash1)
q=0
for url in hash:
url_a=f'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery1910212680783679835_1555073815772&hash={url}&album_id=18784389'
#这个URL不用修改的
c=requests.get(url_a,headers=headers)
a=c.text[40:-3]
b=re.findall('"play_url":"(.*)","authors":',a)[0]
b1=re.sub(r"\\",'',b)
f = requests.get(b1)
with open(hash1[q]+'.mp3','wb')as d:
d.write(f.content)
print(hash1[q])
q+=1

爬取酷狗的唯一难点就是hash值的获取找了一个多小时才找到，比网易云好点就是自己不用写一个哈希值，酷狗是自己就存在的能找到，网易云是需要函数生成的。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python使用beautifulsoup4爬取酷狗音乐代码实例

- Author -

咸鱼日常分享

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python和pyqt实现360的CLable控件

Feb 21 Python

Python程序员鲜为人知但你应该知道的17个问题

Jun 04 Python

python中字符串前面加r的作用

Jun 04 Python

python 3.5下xadmin的使用及修复源码bug

May 10 Python

python制作小说爬虫实录

Aug 14 Python

python的中异常处理机制

Aug 30 Python

Python统计一个字符串中每个字符出现了多少次的方法【字符串转换为列表再统计】

May 05 Python

Python3实现二叉树的最大深度

Sep 30 Python

python 字典有序并写入json文件过程解析

Sep 30 Python

Python大数据之网络爬虫的post请求、get请求区别实例分析

Nov 16 Python

利用PyTorch实现VGG16教程

Jun 24 Python

Python 绘制可视化折线图

Jul 22 Python

python3中numpy函数tile的用法详解

Dec 04 #Python

python 实现目录复制的三种小结

Dec 04 #Python

python求绝对值的三种方法小结

Dec 04 #Python

解决Python3下map函数的显示问题

Dec 04 #Python

Django3.0 异步通信初体验(小结)

Dec 04 #Python

在OpenCV里实现条码区域识别的方法示例

Dec 04 #Python

Python绘图实现显示中文

Dec 04 #Python

You might like

一道求$b相对于$a的相对路径的php代码

2010/08/08 PHP

简单实用的PHP文本缓存类实例

2019/03/22 PHP

PHP xpath提取网页数据内容代码解析

2020/07/16 PHP

PHP实现chrome表单请求数据转换为接口使用的json数据

2021/03/04 PHP

服务器端的JavaScript脚本 Node.js 使用入门

2012/03/07 Javascript

html a标签-超链接中confirm方法使用介绍

2013/01/04 Javascript

JQuery对表格进行操作的常用技巧总结

2014/04/23 Javascript

禁用Enter键表单自动提交实现代码

2014/05/22 Javascript

使用时间戳解决ie缓存的问题

2014/08/20 Javascript

jquery插件splitScren实现页面分屏切换模板特效

2015/06/16 Javascript

jQuery自定义滚动条完整实例

2016/01/08 Javascript

基于Vue2的独立构建与运行时构建的差别(详解)

2017/12/06 Javascript

微信小程序switch开关选择器使用详解

2018/01/31 Javascript

JS装饰器函数用法总结

2018/04/21 Javascript

详解swipe使用及竖屏页面滚动方法

2018/06/28 Javascript

简单了解JavaScript sort方法

2019/11/25 Javascript

Vue解决移动端弹窗滚动穿透问题

2020/12/15 Vue.js

python使用xmlrpc实例讲解

2013/12/17 Python

浅谈Python中的zip()与*zip()函数详解

2018/02/24 Python

Python小进度条显示代码

2019/03/05 Python

python打印9宫格、25宫格等奇数格满足横竖斜相加和相等

2019/07/19 Python

python字典的遍历3种方法详解

2019/08/10 Python

Python numpy.zero() 初始化矩阵实例

2019/11/27 Python

Python实现GIF图倒放

2020/07/16 Python

Django windows使用Apache实现部署流程解析

2020/10/12 Python

python工具——Mimesis的简单使用教程

2021/01/16 Python

法国美发器材和产品购物网站：Beauty Coiffure

2016/12/05 全球购物

Reebok官方旗舰店：美国知名健身品牌锐步

2019/01/07 全球购物

美国户外烹饪产品购物网站：Outdoor Cooking

2020/01/10 全球购物

WSDL的操作类型主要有几种

2013/07/19 面试题

客房领班岗位职责

2015/02/11 职场文书

家长会开场白和结束语

2015/05/29 职场文书

小学体育教学随笔

2015/08/14 职场文书

七年级作文之雪景

2019/11/18 职场文书

mysql 生成连续日期及变量赋值

2022/03/20 MySQL

V Rising 服务器搭建图文教程

2022/06/16 Servers