编程 Python

python中使用百度音乐搜索的api下载指定歌曲的lrc歌词

Posted in Python onJuly 18, 2014

这次这个真的是干货哦，昨晚弄了半晚上，，，，从8点吃完饭就开始写，一直到了快12点才弄好，，，新手，伤不起呀。。。。
先简单的说下吧，百度提供了一个音乐搜索的api，你想百度请求类似于

http://box.zhangmen.baidu.com/x?op=12&count=1&title=最佳损友$$陈奕迅$$$$

的地址，百度会给你返回一段xml，如下所示

This XML file does not appear to have any style information associated with it. The document tree is shown below.
<result>
<count>1</count>
<url>
<encode>
<![CDATA[
 
http://zhangmenshiting.baidu.com/data2/music/12762845/YmRqamdua21fn6NndK6ap5WXcJlrmG1xlJhobWibmGpjk5ZtmWiZcWRjZ5lqbGyelGKWlZtubGljZ5lka2uanWSXY1qin5t1YWBmZW5ocGlhaWdnbGtqbzE$
 
]]>
</encode>
<decode>
<![CDATA[
12762845.mp3?xcode=e6b69cf593ea22ac9d2b9314e565fc0caf85125f065ce3e0&mid=0.31929107437537
]]>
</decode>
<type>8</type>
<lrcid>2829</lrcid>
<flag>1</flag>
</url>
<durl>
<encode>
<![CDATA[
 
http://zhangmenshiting2.baidu.com/data2/music/7345405/aGVnaWlmbGaeomZzrZmmnJZvmGqXbHCbl2dsZ5qXaWqSlWpsmmdrb2mXamxpbXCclGNsmW2ba25mYmxtapmZcWqTWaGemnRoX2VkbWdvaGhoZmZramluOA$$
 
]]>
</encode>
<decode>
<![CDATA[
7345405.mp3?xcode=e6b69cf593ea22ac78e1478e78479dc19e8e4650995cb99a&mid=0.31929107437537
]]>
</decode>
<type>8</type>
<lrcid>2829</lrcid>
<flag>1</flag>
</durl>
<p2p>
<hash>f98b6772aa97966550ec80617879becee0233bf4</hash>
<url>
<![CDATA[ ]]>
</url>
<type>mp3</type>
<size>3778335</size>
<bitrate>128</bitrate>
</p2p>
</result>

简单的说明下，由于我们要做的只是获取到歌曲的lrc歌词地址，所以有用的只有2829这个标签。
而encode和decode里面的拼接起来就是mp3的下载地址，如本例的

http://zhangmenshiting.baidu.com/data2/music/12762845/YmRqamdua21fn6NndK6ap5WXcJlrmG1xlJhobWibmGpjk5ZtmWiZcWRjZ5lqbGyelGKWlZtubGljZ5lka2uanWSXY1qin5t1YWBmZW5ocGlhaWdnbGtqbzE$12762845.mp3?xcode=e6b69cf593ea22ac9d2b9314e565fc0caf85125f065ce3e0&mid=0.31929107437537

就是下载地址，不过音质太差，有时间在研究下这个。
继续说歌词，注意lrcid标签里面的2829
http://box.zhangmen.baidu.com/bdlrc/ 这个是百度lrc歌词存放地址,
然后本例的歌词地址是http://box.zhangmen.baidu.com/bdlrc/28/2829.lrc
看到了吧，歌词地址后面的两个数字的计算方法是在lrcid除以100所获得的整数，就是第一个数字，然后第二个数字就是lrcid，然后后面加上后缀.lrc就搞定了
获得lrc地址之后就简单了，只要请求该地址，然后将获取到的内容写入文件就ok了。
好了，大概就是这样，下面是代码：

import os
import os.path
import re
import eyed3
import urllib2
import urllib
from urllib import urlencode
import sys
 
import os
reload(sys)
sys.setdefaultencoding('utf8')
 
music_path = r"E:\music"
lrc_path = r"e:\lrc"
 
os.remove('nolrc.txt')
os.remove('lrcxml.txt')
 
the_file = open('lrcxml.txt','a')
nolrc_file = open('nolrc.txt','a')
 
for root,dirs,files in os.walk(music_path):
 for filepath in files:
 the_path = os.path.join(root,filepath)
 if (the_path.find("mp3") != -1):
  print the_path
  the_music = eyed3.load(the_path)
  the_teg = the_music.tag._getAlbum()
  the_artist = the_music.tag._getArtist()
  the_title = the_music.tag._getTitle()
  # print the_teg
  # print the_title
  # print the_artist
  b = the_title.replace(' ','+')
  # print b
  a = the_artist.replace(' ','+')
  #print urlencode(str(b))
  if isinstance(a,unicode):
  a = a.encode('utf8')
  song_url = "http://box.zhangmen.baidu.com/x?op=12&count=1&title="+b+"$$"+a+"$$$$ "
  
  the_file.write(song_url+'\n')
  page = urllib2.urlopen(song_url).read()
  print page
  theid = 0
  
  lrcid = re.compile('<lrcid>(.*?)</lrcid>',re.S).findall(page)
  have_lrc = True
  if lrcid != []:
  theid = lrcid[0]
   
  else:
  nolrc_file.write(the_title+'\n')
  have_lrc = False
  print theid
  
  
  if have_lrc:
  firstid = int(theid)/100
  lrcurl = "http://box.zhangmen.baidu.com/bdlrc/"+str(firstid)+"/"+theid+".lrc"
  print lrcurl
  lrc = urllib2.urlopen(lrcurl).read()
  if(lrc.find('html')== -1):
   lrcfile = open(lrc_path+"\\"+the_title+".lrc",'w')
   lrcfile.writelines(lrc)
   lrcfile.close()
  else:
   nolrc_file.write(the_title+'\n')
   
the_file.close()
nolrc_file.close()
print "end!"

有用第一步请求所获取到底是xml格式的，所以本来想着解析xml来获取lrcid，但是在实现过程中遇到了各种问题，别的还容易，就在这一块儿浪费的时间最长，纠结未果之后，只能改用正则表达式来获取了。。。只能说明还是学艺不精呢

原文：逝去日子的博客 » 使用python扫描本地音乐并下载歌词

python中使用百度音乐搜索的api下载指定歌曲的lrc歌词

- Author -

junjie

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python写的创建文件夹自定义函数mkdir()

Aug 25 Python

Python标准库之随机数 (math包、random包)介绍

Nov 25 Python

浅谈Python黑帽子取代netcat

Feb 10 Python

Python中安装easy_install的方法

Nov 18 Python

python实现BP神经网络回归预测模型

Aug 09 Python

Python imread、newaxis用法详解

Nov 04 Python

pytorch实现focal loss的两种方式小结

Jan 02 Python

pytorch模型存储的2种实现方法

Feb 14 Python

python GUI库图形界面开发之PyQt5 Qt Designer工具(Qt设计师)详细使用方法及Designer ui文件转py文件方法

Feb 26 Python

python3 正则表达式基础廖雪峰

Mar 25 Python

keras读取h5文件load_weights、load代码操作

Jun 12 Python

Python 如何对文件目录操作

Jul 10 Python

python采集博客中上传的QQ截图文件

Jul 18 #Python

Python下singleton模式的实现方法

Jul 16 #Python

python的迭代器与生成器实例详解

Jul 16 #Python

Python的内存泄漏及gc模块的使用分析

Jul 16 #Python

Python的垃圾回收机制深入分析

Jul 16 #Python

python中将字典转换成其json字符串

Jul 16 #Python

记录Django开发心得

Jul 16 #Python

You might like

中国广播史趣谈 — 几个历史第一次

2021/03/01 无线电

在Windows中安装Apache2和PHP4的权威指南

2006/10/09 PHP

PHP递归删除目录几个代码实例

2014/04/21 PHP

CodeIgniter CLI模式简介

2014/06/17 PHP

利用PHP计算有多少小于当前数字的数字方法示例

2020/08/26 PHP

javascript replace方法与正则表达式

2008/02/19 Javascript

20个非常有用的PHP类库加速php开发

2010/01/15 Javascript

JavaScript操作XML实例代码（获取新闻标题并分页，并分页）

2010/05/25 Javascript

浅谈checkbox的一些操作(实战经验)

2013/11/20 Javascript

JavaScript数组实现数据结构中的队列与堆栈

2016/05/26 Javascript

Node.js中看JavaScript的引用

2017/04/22 Javascript

原生JS实现N级菜单的代码

2017/05/21 Javascript

Bootstrap table使用方法汇总

2017/11/17 Javascript

Parcel.js + Vue 2.x 极速零配置打包体验教程

2017/12/24 Javascript

20行JS代码实现粘贴板复制功能

2018/02/06 Javascript

对layer弹出框中icon数字参数的说明介绍

2019/09/04 Javascript

layui table 复选框跳页后再回来保持原来选中的状态示例

2019/10/26 Javascript

Python的爬虫程序编写框架Scrapy入门学习教程

2016/07/02 Python

对pandas通过索引提取dataframe的行方法详解

2019/02/01 Python

Python 一键制作微信好友图片墙的方法

2019/05/16 Python

nginx黑名单和django限速,最简单的防恶意请求方法分享

2019/08/09 Python

使用 Python 写一个简易的抽奖程序

2019/12/08 Python

巴西宠物店在线：Geração Pet

2017/05/31 全球购物

ASOS西班牙官网：英国在线时尚和美容零售商

2020/01/10 全球购物

Web Service面试题：如何搭建Axis2的开发环境

2012/06/20 面试题

电子商务专业推荐信范文

2013/12/02 职场文书

医药代表个人的求职信分享

2013/12/08 职场文书

个人优缺点自我评价

2014/01/27 职场文书

网上商城创业计划书范文

2014/01/31 职场文书

元旦晚会活动总结

2014/07/09 职场文书

机关单位工作失职检讨书

2014/11/20 职场文书

六一晚会主持词开场白

2015/05/28 职场文书

总结Java对象被序列化的两种方法

2021/06/30 Java/Android

一文带你探究MySQL中的NULL

2021/11/11 MySQL

MySQL优化常用的19种有效方法(推荐!)

2022/03/17 MySQL

Python PIL按比例裁剪图片

2022/05/11 Python