python使用beautifulsoup4爬取酷狗音乐代码实例


Posted in Python onDecember 04, 2019

这篇文章主要介绍了python使用beautifulsoup4爬取酷狗音乐代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

小编经常在网上听一些音乐但是有一些网站好多音乐都是付费下载的正好我会点爬虫技术,空闲时间写了一份,截止4月底没有问题的,会下载到当前目录,只要按照bs4库就好,

安装方法:pip install beautifulsoup4

完整代码如下:双击就能直接运行

from bs4 import BeautifulSoup
import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'
}
url='https://songsearch.kugou.com/song_search_v2?&page=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_filter=0&_=1555124510574'
#想要爬取别的网页直接修改这个json数据地址就行
r=requests.get(url,headers=headers)
soup=BeautifulSoup(r.text,'lxml')
title_list=soup.select('.pc_temp_songlist ul li')
hash=re.findall(r',"FileHash":"(.*?)"',r.text)
hash1=re.findall(r',"FileName":"(.*?)"',r.text)
#直接用正则匹配隐藏的数据
print(hash)
print(hash1)
q=0
for url in hash:
url_a=f'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery1910212680783679835_1555073815772&hash={url}&album_id=18784389'
#这个URL不用修改的
c=requests.get(url_a,headers=headers)
a=c.text[40:-3]
b=re.findall('"play_url":"(.*)","authors":',a)[0]
b1=re.sub(r"\\",'',b)
f = requests.get(b1)
with open(hash1[q]+'.mp3','wb')as d:
d.write(f.content)
print(hash1[q])
q+=1

爬取酷狗的唯一难点就是hash值的获取找了一个多小时才找到,比网易云好点就是自己不用写一个哈希值,酷狗是自己就存在的能找到,网易云是需要函数生成的。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python和pyqt实现360的CLable控件
Feb 21 Python
Python程序员鲜为人知但你应该知道的17个问题
Jun 04 Python
python中字符串前面加r的作用
Jun 04 Python
python 3.5下xadmin的使用及修复源码bug
May 10 Python
python制作小说爬虫实录
Aug 14 Python
python的中异常处理机制
Aug 30 Python
Python统计一个字符串中每个字符出现了多少次的方法【字符串转换为列表再统计】
May 05 Python
Python3实现二叉树的最大深度
Sep 30 Python
python 字典有序并写入json文件过程解析
Sep 30 Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 Python
利用PyTorch实现VGG16教程
Jun 24 Python
Python 绘制可视化折线图
Jul 22 Python
python3中numpy函数tile的用法详解
Dec 04 #Python
python 实现目录复制的三种小结
Dec 04 #Python
python求绝对值的三种方法小结
Dec 04 #Python
解决Python3下map函数的显示问题
Dec 04 #Python
Django3.0 异步通信初体验(小结)
Dec 04 #Python
在OpenCV里实现条码区域识别的方法示例
Dec 04 #Python
Python绘图实现显示中文
Dec 04 #Python
You might like
一道求$b相对于$a的相对路径的php代码
2010/08/08 PHP
简单实用的PHP文本缓存类实例
2019/03/22 PHP
PHP xpath提取网页数据内容代码解析
2020/07/16 PHP
PHP实现chrome表单请求数据转换为接口使用的json数据
2021/03/04 PHP
服务器端的JavaScript脚本 Node.js 使用入门
2012/03/07 Javascript
html a标签-超链接中confirm方法使用介绍
2013/01/04 Javascript
JQuery对表格进行操作的常用技巧总结
2014/04/23 Javascript
禁用Enter键表单自动提交实现代码
2014/05/22 Javascript
使用时间戳解决ie缓存的问题
2014/08/20 Javascript
jquery插件splitScren实现页面分屏切换模板特效
2015/06/16 Javascript
jQuery自定义滚动条完整实例
2016/01/08 Javascript
基于Vue2的独立构建与运行时构建的差别(详解)
2017/12/06 Javascript
微信小程序switch开关选择器使用详解
2018/01/31 Javascript
JS装饰器函数用法总结
2018/04/21 Javascript
详解swipe使用及竖屏页面滚动方法
2018/06/28 Javascript
简单了解JavaScript sort方法
2019/11/25 Javascript
Vue解决移动端弹窗滚动穿透问题
2020/12/15 Vue.js
python使用xmlrpc实例讲解
2013/12/17 Python
浅谈Python中的zip()与*zip()函数详解
2018/02/24 Python
Python小进度条显示代码
2019/03/05 Python
python打印9宫格、25宫格等奇数格 满足横竖斜相加和相等
2019/07/19 Python
python字典的遍历3种方法详解
2019/08/10 Python
Python numpy.zero() 初始化矩阵实例
2019/11/27 Python
Python实现GIF图倒放
2020/07/16 Python
Django windows使用Apache实现部署流程解析
2020/10/12 Python
python工具——Mimesis的简单使用教程
2021/01/16 Python
法国美发器材和产品购物网站:Beauty Coiffure
2016/12/05 全球购物
Reebok官方旗舰店:美国知名健身品牌锐步
2019/01/07 全球购物
美国户外烹饪产品购物网站:Outdoor Cooking
2020/01/10 全球购物
WSDL的操作类型主要有几种
2013/07/19 面试题
客房领班岗位职责
2015/02/11 职场文书
家长会开场白和结束语
2015/05/29 职场文书
小学体育教学随笔
2015/08/14 职场文书
七年级作文之雪景
2019/11/18 职场文书
mysql 生成连续日期及变量赋值
2022/03/20 MySQL
V Rising 服务器搭建图文教程
2022/06/16 Servers