python使用beautifulsoup4爬取酷狗音乐代码实例


Posted in Python onDecember 04, 2019

这篇文章主要介绍了python使用beautifulsoup4爬取酷狗音乐代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

小编经常在网上听一些音乐但是有一些网站好多音乐都是付费下载的正好我会点爬虫技术,空闲时间写了一份,截止4月底没有问题的,会下载到当前目录,只要按照bs4库就好,

安装方法:pip install beautifulsoup4

完整代码如下:双击就能直接运行

from bs4 import BeautifulSoup
import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'
}
url='https://songsearch.kugou.com/song_search_v2?&page=1&pagesize=30&userid=-1&clientver=&platform=WebFilter&tag=em&filter=2&iscorrection=1&privilege_filter=0&_=1555124510574'
#想要爬取别的网页直接修改这个json数据地址就行
r=requests.get(url,headers=headers)
soup=BeautifulSoup(r.text,'lxml')
title_list=soup.select('.pc_temp_songlist ul li')
hash=re.findall(r',"FileHash":"(.*?)"',r.text)
hash1=re.findall(r',"FileName":"(.*?)"',r.text)
#直接用正则匹配隐藏的数据
print(hash)
print(hash1)
q=0
for url in hash:
url_a=f'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery1910212680783679835_1555073815772&hash={url}&album_id=18784389'
#这个URL不用修改的
c=requests.get(url_a,headers=headers)
a=c.text[40:-3]
b=re.findall('"play_url":"(.*)","authors":',a)[0]
b1=re.sub(r"\\",'',b)
f = requests.get(b1)
with open(hash1[q]+'.mp3','wb')as d:
d.write(f.content)
print(hash1[q])
q+=1

爬取酷狗的唯一难点就是hash值的获取找了一个多小时才找到,比网易云好点就是自己不用写一个哈希值,酷狗是自己就存在的能找到,网易云是需要函数生成的。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中使用mongoengine操作MongoDB教程
Apr 24 Python
详解Python中列表和元祖的使用方法
Apr 25 Python
Python cx_freeze打包工具处理问题思路及解决办法
Feb 13 Python
利用python画一颗心的方法示例
Jan 31 Python
让Python更加充分的使用Sqlite3
Dec 11 Python
详解Python自建logging模块
Jan 29 Python
Python Learning 列表的更多操作及示例代码
Aug 22 Python
Python使用matplotlib实现交换式图形显示功能示例
Sep 06 Python
python基于FTP实现文件传输相关功能代码实例
Sep 28 Python
django处理select下拉表单实例(从model到前端到post到form)
Mar 13 Python
selenium3.0+python之环境搭建的方法步骤
Feb 01 Python
python爬不同图片分别保存在不同文件夹中的实现
Apr 02 Python
python3中numpy函数tile的用法详解
Dec 04 #Python
python 实现目录复制的三种小结
Dec 04 #Python
python求绝对值的三种方法小结
Dec 04 #Python
解决Python3下map函数的显示问题
Dec 04 #Python
Django3.0 异步通信初体验(小结)
Dec 04 #Python
在OpenCV里实现条码区域识别的方法示例
Dec 04 #Python
Python绘图实现显示中文
Dec 04 #Python
You might like
smarty巧妙处理iframe中内容页的代码
2012/03/07 PHP
php获取本地图片文件并生成xml文件输出具体思路
2013/04/27 PHP
浅析PHP的静态成员函数效率更高的原因
2014/06/13 PHP
laravel中Redis队列监听中断的分析
2020/09/14 PHP
node.js中的querystring.parse方法使用说明
2014/12/10 Javascript
javascript垃圾收集机制的原理分析
2016/12/08 Javascript
js生成随机颜色方法代码分享(三种)
2016/12/29 Javascript
基于jQuery实现简单人工智能聊天室
2017/02/10 Javascript
JS之if语句对接事件动作逻辑(详解)
2017/06/28 Javascript
ionic2懒加载配置详解
2017/09/01 Javascript
Vue实现点击箭头上下移动效果
2020/06/11 Javascript
[01:15:18]2014 DOTA2国际邀请赛中国区预选赛 LGD VS Speed Gaming.cn
2014/05/22 DOTA
Python之eval()函数危险性浅析
2014/07/03 Python
Python 加密的实例详解
2017/10/09 Python
详解python中asyncio模块
2018/03/03 Python
Python使用matplotlib实现的图像读取、切割裁剪功能示例
2018/04/28 Python
python常用函数与用法示例
2019/07/02 Python
使用 Python 清理收藏夹里已失效的网站
2019/12/03 Python
virtualenv介绍及简明教程
2020/06/23 Python
django创建css文件夹的具体方法
2020/07/31 Python
python字典与json转换的方法总结
2020/12/28 Python
python asyncio 协程库的使用
2021/01/21 Python
python自动化办公操作PPT的实现
2021/02/05 Python
HTML5 与 XHTML2
2008/10/17 HTML / CSS
英国探险旅游专家:Explore
2018/12/20 全球购物
自我评价如何写好?
2014/01/05 职场文书
五一服装活动方案
2014/01/11 职场文书
人力资源经理的岗位职责范本
2014/02/28 职场文书
颂军魂爱军营演讲稿
2014/09/13 职场文书
工伤事故赔偿协议书
2014/10/27 职场文书
临时用工协议书范本
2014/10/29 职场文书
2014年学校财务工作总结
2014/12/06 职场文书
数学考试作弊检讨书300字
2015/02/16 职场文书
2015年大学班主任工作总结
2015/04/30 职场文书
2015年行政执法工作总结
2015/05/23 职场文书
PHP 时间处理类Carbon
2022/05/20 PHP