编程 Python

Python基于爬虫实现全网搜索并下载音乐

Posted in Python onFebruary 14, 2021

现在写一篇博客总是喜欢先谈需求或者本内容的应用场景，是的，如果写出来的东西没有任何应用价值，确实也没有实际意义。今天的最早的需求是来自于如何免费[白嫖]下载全网优质音乐，我去b站上面搜索到了一个大牛做过的一个歌曲搜素神器，界面是这样的：

确实很好用的，而且涵盖了互联网上面大多数主流的音乐网站，涉及到的版本也很多，可谓大而全，但是一个技术人的追求远远不会如此，于是我就想去了解其中背后的原理，因为做过网络爬虫的人都知道，爬虫只能爬取某一页或者某些页的网站资源，所以我很好奇它背后是怎么实现的？
笔者一直以来都是做的基于Python3.7版本的网络爬虫，所以本文也是基于此来学习记录的。首先爬取的网站不是对应的音乐网站，而是一个音乐直链搜索，那里汇聚了大多数音频音乐的解析功能，界面如下：

Python基于爬虫实现全网搜索并下载音乐

所以自制一个搜索引擎的思想也很直观了，那就是利用第三方的接口，直接对该服务器发起请求即可，然后将获取的数据进行解析保存。这里以最近比较火的歌曲“白月光与朱砂痣”下载为例：

Python基于爬虫实现全网搜索并下载音乐

解析的结果如上，获取的数据格式是json类型，并且除了要有歌名以外，还要有音乐平台。

源代码实现如下：

import requests
import jsonpath
import os
"""
  1.url
  2.模拟浏览器请求
  3.解析网页源代码
  4.保存数据
"""
def song_download(url,title,author):
  # 创建文件夹
  os.makedirs("music",exist_ok=True)
  path = 'music\{}.mp3'.format(title)
  print('歌曲:{0}-{1},正在下载...'.format(title,author))
  # 下载（这种读写文件的下载方式适合少量文件的下载）
  content = requests.get(url).content
  with open(file = title + author + '.mp3',mode='wb') as f:
    f.write(content)
  print('下载完毕,{0}-{1},请试听'.format(title,author))

def get_music_name():
  """
  搜索歌曲名称
  :return:
  """
  name = input("请输入歌曲名称:")
  print("1.网易云:netease\n2.QQ:qq\n3.酷狗:kugou\n4.酷我:kuwo\n5.百度:baidu\n6.喜马拉雅:ximalaya")
  platfrom = input("输入音乐平台类型:")
  print("-------------------------------------------------------")
  url = 'https://music.liuzhijin.cn/'
  headers = {
    "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36",
    # 判断请求是异步还是同步
    "x-requested-with":"XMLHttpRequest",
  }
  param = {
    "input":name,
    "filter":"name",
    "type":platfrom,
    "page": 1,
  }
  res = requests.post(url=url,data=param,headers=headers)
  json_text = res.json()

  title = jsonpath.jsonpath(json_text,'$..title')
  author = jsonpath.jsonpath(json_text,'$..author')
  url = jsonpath.jsonpath(json_text, '$..url')
  if title:
    songs = list(zip(title,author,url))
    for s in songs:
      print(s[0],s[1],s[2])
    print("-------------------------------------------------------")
    index = int(input("请输入您想下载的歌曲版本:"))
    song_download(url[index],title[index],author[index])
  else:
    print("对不起，暂无搜索结果!")

if __name__ == "__main__":
  get_music_name()

演示一下运行效果：

Python基于爬虫实现全网搜索并下载音乐

然后文件下就会出现对应的歌曲.mp3文件

Python基于爬虫实现全网搜索并下载音乐

并且每次的歌曲检索都是在PyCharm专业版的控制台中进行的，这样的用户体验就非常糟糕，所以针对以上两个问题，我对源代码进行了改进。

# 导入模块
from tkinter import *
import requests
import jsonpath
import os
from urllib.request import urlretrieve

# 2.功能实现
"""
  1.url
  2.模拟浏览器请求
  3.解析网页源代码
  4.保存数据
"""
def song_download(url,title,author):
  # 创建文件夹
  os.makedirs("music",exist_ok=True)
  path = 'music\{}.mp3'.format(title)
  text.insert(END,'歌曲:{0}-{1},正在下载...'.format(title,author))
  # 文本框滑动
  text.see(END)
  # 更新
  text.update()
  # 下载
  urlretrieve(url,path)
  text.insert(END,'下载完毕,{0}-{1},请试听'.format(title,author))
  # 文本框滑动
  text.see(END)
  # 更新
  text.update()

def get_music_name():
  """
  搜索歌曲名称
  :return:
  """
  name = entry.get()
  platfrom = var.get()
  # name = '白月光与朱砂痣'
  url = 'https://music.liuzhijin.cn/'
  headers = {
    "user-agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36",
    # 判断请求是异步还是同步
    "x-requested-with":"XMLHttpRequest",
  }
  param = {
    "input":name,
    "filter":"name",
    "type":platfrom,
    "page": 1,
  }
  res = requests.post(url=url,data=param,headers=headers)
  json_text = res.json()

  title = jsonpath.jsonpath(json_text,'$..title')
  author = jsonpath.jsonpath(json_text,'$..author')
  url = jsonpath.jsonpath(json_text, '$..url')
  print(title,author,url)
  song_download(url[0],title[0],author[0])


# 1.用户界面
# 创建画板
root = Tk()
# 设置窗口标题
root.title('全网音乐下载器')
# 设置窗口大小以及出现的位置
root.geometry('560x450+400+200')
# 标签组件
label = Label(root,text="请输入下载的歌曲:",font=('楷体',20))
# 定位与布局
label.grid(row=0)
# 输入框组件
entry = Entry(root,font=('宋体',20))
entry.grid(row=0,column=1)
# 单选按钮
var = StringVar()
r1 = Radiobutton(root,text='网易云',variable=var,value='netease')
r1.grid(row=1,column=0)
r2 = Radiobutton(root,text='QQ',variable=var,value='qq')
r2.grid(row=1,column=1)
# 列表框
text = Listbox(root,font=('楷体',16),width=50,height=15)
text.grid(row=2,columnspan=2)
# 下载按钮
button1 = Button(root,text='开始下载',font=('楷体',15),command=get_music_name)
button1.grid(row=3,column=0)
button2 = Button(root,text='退出程序',font=('楷体',15),command=root.quit)
button2.grid(row=3,column=1)
# 显示界面
root.mainloop()

我们再来看看效果吧

Python基于爬虫实现全网搜索并下载音乐

这样加上了UI界面和部分代码优化之后，就可以通过.py代码打包成.exe文件发布给用户使用了。

以上就是Python基于爬虫实现全网搜索并下载音乐的详细内容，更多关于python 爬虫下载音乐的资料请关注三水点靠木其它相关文章！

Python基于爬虫实现全网搜索并下载音乐

- Author -

TrainingL

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

详解python中的文件与目录操作

Jul 11 Python

python实现用户答题功能

Jan 17 Python

python中实现数组和列表读取一列的方法

Apr 03 Python

python并发编程多进程互斥锁原理解析

Aug 20 Python

深入了解python中元类的相关知识

Aug 29 Python

python二进制读写及特殊码同步实现详解

Oct 11 Python

使用python模拟高斯分布例子

Dec 09 Python

在python中利用try..except来代替if..else的用法

Dec 19 Python

Tensorflow 卷积的梯度反向传播过程

Feb 10 Python

TensorBoard 计算图的查看方式

Feb 15 Python

Python基础之字符串常见操作经典实例详解

Feb 26 Python

Python3中最常用的5种线程锁实例总结

Jul 07 Python

Python LMDB库的使用示例

Feb 14 #Python

python 装饰器重要在哪

Feb 14 #Python

python爬虫如何解决图片验证码

Feb 14 #Python

Python实现粒子群算法的示例

Feb 14 #Python

Python中对象的比较操作==和is区别详析

Feb 12 #Python

python绘图模块之利用turtle画图

Feb 12 #Python

Python列表的深复制和浅复制示例详解

Feb 12 #Python

You might like

PHPWind与Discuz截取字符函数substrs与cutstr性能比较

2011/12/05 PHP

ThinkPHP之import方法实例详解

2014/06/20 PHP

PHP字符串word末字符实现大小写互换的方法

2014/11/10 PHP

JQuery 拾色器插件发布-jquery.icolor.js

2010/10/20 Javascript

node.js 一个简单的页面输出实现代码

2012/03/07 Javascript

node.js中的fs.fstat方法使用说明

2014/12/15 Javascript

javascript 获取浏览器版本

2015/01/21 Javascript

jQuery的事件委托实例分析

2015/07/15 Javascript

JS实现随页面滚动显示/隐藏窗口固定位置元素

2016/02/26 Javascript

jQuery实现布局高宽自适应的简单实例

2016/05/28 Javascript

Javascript将字符串日期格式化为yyyy-mm-dd的方法

2016/10/27 Javascript

JS无缝滚动效果实现方法分析

2016/12/21 Javascript

vue.js或js实现中文A-Z排序的方法

2018/03/08 Javascript

Python语言技巧之三元运算符使用介绍

2013/03/04 Python

使用python加密自己的密码

2015/08/04 Python

python使用正则表达式替换匹配成功的组并输出替换的次数

2017/11/22 Python

使用python脚本实现查询火车票工具

2018/07/19 Python

Python实现点云投影到平面显示

2020/01/18 Python

PyQt5中多线程模块QThread使用方法的实现

2020/01/31 Python

Python的pygame安装教程详解

2020/02/10 Python

django在保存图像的同时压缩图像示例代码详解

2020/02/11 Python

PIL包中Image模块的convert()函数的具体使用

2020/02/26 Python

python 如何利用argparse解析命令行参数

2020/09/11 Python

利用Python发送邮件或发带附件的邮件

2020/11/12 Python

Python3使用Selenium获取session和token方法详解

2021/02/16 Python

北美三大旅游网站之一：Travelocity

2017/08/12 全球购物

北京天润融通.net面试题笔试题

2012/02/20 面试题

棉花姑娘教学反思

2014/02/15 职场文书

运动会广播稿20字

2014/02/18 职场文书

2014年六一儿童节演讲稿

2014/05/23 职场文书

安全标语口号

2014/06/09 职场文书

英语专业自荐书

2014/06/13 职场文书

党支部党的群众路线对照检查材料

2014/09/24 职场文书

信用卡催款律师函

2015/05/27 职场文书

云服务器部署 Web 项目的实现步骤

2022/06/28 Servers