编程 Python

Python多线程结合队列下载百度音乐的方法

Posted in Python onJuly 27, 2015

本文实例讲述了Python多线程结合队列下载百度音乐的方法。分享给大家供大家参考。具体如下：

一直想做个下载音乐的脚本，后来决定就拿百度音乐开刀，经过多次分析，终于制作了一个下载百度音乐的脚本，目前只默认下载第一页，童鞋们可以自由拓展。
适用Windows和Linux平台、依赖BeautifulSoup这个库，主要对HTML进行解析

#!/usr/bin/python
# -*- coding: utf-8 -*-
'''
 百度中批量下载某歌手的歌(目前只下载第一页，可以自行拓展)
 @author:admin
 @qq: 1243385033
'''
import threading, urllib2, os,re,sys
from bs4 import BeautifulSoup
from Queue import Queue
'''目标歌手'''
SINGER = u'亚东'
'''保存路径'''
SAVE_FOLDER = 'F:/music/'
# 查询url
search_url = "http://music.baidu.com/search/song?key=%s&s=1"
# 百度音乐播放盒url
song_url = "http://box.zhangmen.baidu.com/x?op=12&count=1&mtype=1&title="
class Downloader(threading.Thread):
  def __init__(self, task):
    threading.Thread.__init__(self)
    self.task = task
  def run(self):
    '''覆盖父类的run方法'''
    while True:
      url = self.task.get()
      self.download(url)
      self.task.task_done()
  def build_path(self, filename):
    join = os.path.join
    parentPath=join(SAVE_FOLDER,SINGER)
    filename = filename + '.mp3'
    myPath = join(parentPath, filename)
    return myPath
  def download(self, url):
    '''下载文件'''
    sub_url = url.items()
    f_name = sub_url[0][0]
    req_url = sub_url[0][1]
    handle = urllib2.urlopen(req_url)
    # 保存路径
    save_path = self.build_path(f_name)
    with open(save_path, "wb") as handler:
      while True:
        chunk = handle.read(1024)
        if not chunk:
          break
        handler.write(chunk)
        msg = u"已经从 %s下载完成" % req_url
      sys.stdout.write(msg)
      sys.stdout.flush()
class HttpRequest:
  def __init__(self):
    self.task = []
    self.reg_decode = re.compile('<decode>.*?CDATA\[(.*?)\]].*?</decode>')
    self.reg_encode = re.compile('<encode>.*?CDATA\[(.*?)\]].*?</encode>')
    self.init()
    self.target_url = search_url % urllib2.quote(self.encode2utf8(SINGER))
  def encode2utf8(self,source):
    if source and isinstance(source,(str,unicode)):
      source=source.encode("utf8")
      return source
    return source
  def mkDir(self, dir_name):
    if not os.path.exists(dir_name):
      os.mkdir(dir_name)
  def init(self):
    self.mkDir(SAVE_FOLDER)
    subPath = os.path.join(SAVE_FOLDER, SINGER)
    self.mkDir(subPath)
  def http_request(self):
    global song_url
    '''发起请求'''
    response=urllib2.urlopen(self.target_url)
    # 获取头信息
    content = response.read()
    response.close()
    # 使用BeautifulSoup
    html = BeautifulSoup(content, from_encoding="utf8")
    # 提取HTML标签
    span_tag = html.find_all('div', {"monkey":"song-list"})[0].find_all('span', class_='song-title')
      # 遍历List
    for a_tag in span_tag:
      song_name = unicode(a_tag.find_all("a")[0].get_text())
      song_url = song_url + urllib2.quote(self.encode2utf8(song_name))
      song_url = song_url + '$$' + urllib2.quote(self.encode2utf8(SINGER)) + '$$$$&url=&listenreelect=0&.r=0.1696378872729838'
      xmlfile = urllib2.urlopen(song_url)
      xml_content = xmlfile.read()
      xmlfile.close()
      url1 = re.findall(self.reg_encode, xml_content)
      url2 = re.findall(self.reg_decode, xml_content)
      if not url1 or not url2:
        continue
      url = url1[0][:url1[0].rindex('/') + 1] + url2[0]
      self.task.append({song_name:url})
    return self.task
def start_download(urls):
  #创建一个队列
  quene=Queue()
  #获取list的大小
  size=len(urls)
  #开启线程
  for _ in xrange(size):
    t=Downloader(quene)
    t.setDaemon(True)
    t.start()
  #入队列
  for url in urls:
    quene.put(url)
  quene.join()
if __name__=='__main__':
  http=HttpRequest()
  urls=http.http_request()
  start_download(urls)

希望本文所述对大家的Python程序设计有所帮助。

Python多线程结合队列下载百度音乐的方法

- Author -

御寒

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

pycharm 使用心得（八）如何调用另一文件中的函数

Jun 06 Python

Python生成验证码实例

Aug 21 Python

Python的函数的一些高阶特性

Apr 27 Python

介绍Python中的fabs()方法的使用

May 14 Python

Python内建数据结构详解

Feb 03 Python

用生成器来改写直接返回列表的函数方法

May 25 Python

python:pandas合并csv文件的方法(图书数据集成)

Apr 12 Python

在python win系统下打开TXT文件的实例

Apr 29 Python

基于Python的PIL库学习详解

May 10 Python

python字符串和常用数据结构知识总结

May 21 Python

Python队列、进程间通信、线程案例

Oct 25 Python

Python必备技巧之函数的使用详解

Apr 04 Python

在Django框架中设置语言偏好的教程

Jul 27 #Python

在Python的Django框架中创建语言文件

Jul 27 #Python

在Django的模型和公用函数中使用惰性翻译对象

Jul 27 #Python

使用Django的模版来配合字符串翻译工作

Jul 27 #Python

Django中的“惰性翻译”方法的相关使用

Jul 27 #Python

在Python中的Django框架中进行字符串翻译

Jul 27 #Python

Python中特殊函数集锦

Jul 27 #Python

You might like

php print EOF实现方法

2009/05/21 PHP

php加密解密函数authcode的用法详细解析

2013/10/28 PHP

smarty中英文多编码字符截取乱码问题解决方法

2014/10/28 PHP

PHP代码实现爬虫记录――超管用

2015/07/31 PHP

PHP实现HTML页面静态化的方法

2015/11/04 PHP

YII Framework框架教程之国际化实现方法

2016/03/14 PHP

做网页的一些技巧（续）

2007/02/01 Javascript

半角全角相互转换的js函数

2009/10/16 Javascript

document.body.scrollTop 值总为0的解决方法比较常见的标准问题

2009/11/30 Javascript

JavaScript实现简单的时钟实例代码

2013/11/23 Javascript

jQuery打印指定区域Html页面并自动分页

2014/07/04 Javascript

jQuery实现点击该行即可删除HTML表格行

2014/10/17 Javascript

浅谈javascript中this在事件中的应用

2015/02/15 Javascript

JavaScript实现select添加option

2015/07/03 Javascript

gulp-htmlmin压缩html的gulp插件实例代码

2016/06/06 Javascript

nodejs入门教程六：express模块用法示例

2017/04/24 NodeJs

微信小程序中post方法与get方法的封装

2017/09/26 Javascript

如何用input标签和jquery实现多图片的上传和回显功能

2018/05/16 jQuery

vue 利用路由守卫判断是否登录的方法

2018/09/29 Javascript

微信小程序学习笔记之跳转页面、传递参数获得数据操作图文详解

2019/03/28 Javascript

详解jQuery如何实现模糊搜索

2019/05/10 jQuery

微信小程序自定义toast组件的方法详解【含动画】

2019/05/11 Javascript

vue项目配置同一局域网可使用ip访问的操作

2020/10/23 Javascript

Python从使用线程到使用async/await的深入讲解

2018/09/16 Python

Python实现变声器功能(萝莉音御姐音)

2019/12/05 Python

Matplotlib使用Cursor实现UI定位的示例代码

2020/03/12 Python

Pycharm安装第三方库失败解决方案

2020/11/17 Python

python包的导入方式总结

2021/03/02 Python

使用before和:after伪类制作css3圆形按钮

2014/04/08 HTML / CSS

阿里云：Aliyun.com

2017/02/15 全球购物

海蓝之谜英国官网：La Mer英国

2020/01/15 全球购物

优秀班集体获奖感言

2014/02/03 职场文书

小学教师国培感言

2014/02/08 职场文书

新闻发布会新闻稿

2015/07/17 职场文书

教你漂亮打印Pandas DataFrames和Series

2021/05/29 Python

java开发双人五子棋游戏

2022/05/06 Java/Android