基于python实现的百度音乐下载器python pyqt改进版(附代码)


Posted in Python onAugust 05, 2019

前言

之前写过一个用python实现的百度新歌榜、热歌榜下载器的文章,实现了百度新歌、热门歌曲的爬取与下载。但那个采用的是单线程,网络状况一般的情况下,扫描前100首歌的时间大概得到40来秒。而且用Pyqt做的界面,在下载的过程中进行窗口操作,会出现UI阻塞的现象。

前两天有时间调整了一下,做了几方面的改进:

1.修改了UI界面阻塞的问题,下载的过程中可以进行其它的UI操作;

2.爬虫程序采用一个主线程,8个子线程的方式快速爬取,网络状况一致的情况下,将扫描100首歌曲的时间提高到了8、9秒左右;(本地下载速度大概300K左右)

3.解析网页的方法由之前的HtmlParser变成了现在的BeautifulSoup;

要运行此功能需要安装PyQt、BeautifulSoup。运行之前需要在settings.py文件中配置百度账号和密码。

username = "your baidu acount" #配置你的百度账号 
password = "your baidu password" #配置你的百度密码

配置好账户和密码后,直接双击spiderMan.py文件运行即可。

运行流程

1.首先由spiderMan.py进入主程序,开始运行。

2.主程序将控制权交给dispatcher调度程序,调度程序首先登录百度。

3.如果登录成功,调度程序开启8个子线程,由这8个子线程抓取百度新歌榜或百度热歌榜的歌曲链接,分析链接,获取真正的下载地址,并将下载地址、歌曲名称、歌手信息写入一个文本文件。

4.当子线程执行完毕,主程序读取上一步生成的文本文件,加载UI窗体。

整个过程如下图:

基于python实现的百度音乐下载器python pyqt改进版(附代码)

正常运行后的效果如下图:

基于python实现的百度音乐下载器python pyqt改进版(附代码)

问题:

在github上tigerstudent提出了两个问题:

1.文件spiderMan.py中获取当前脚本所在的目录 root = os.path.dirname(__file__)+"/" 获取到的目录为空,建议应该用os.getcwd()。

这里我实际想要的是当前脚本所在的绝对路径,正确的脚本应该是这样的:os.path.abspath(os.path.dirname(__file__))+"/"

那么为什么os.path.dirname(__file__)os.getcwd()为什么都不行呢?os.path.dirname(__file__)是当前脚本相对于脚本的执行目录的相对路径,而os.getcwd()是脚本实际执行的目录。新建test.py文件,代码如下:

import os 
print("os.path.dirname(__file__):"+os.path.dirname(__file__)) 
print("os.getcwd():"+os.getcwd())

首先定位到计算机根目录/,执行如下命令:python /home/fengzheng/vimPython/BaiduMusicSpider-master/test.py,输出结果:

os.path.dirname(__file__):/home/fengzheng/vimPython/BaiduMusicSpider-master 
os.getcwd():

 定位到/home/fengzheng/vimPython/,执行如下命令:python BaiduMusicSpider-master/test.py,输出结果:

os.path.dirname(__file__):BaiduMusicSpider-master 
os.getcwd():/home/fengzheng/vimPython

这样说吧,抛开执行上的参数值,在windows下把命令理解为单击鼠标直接运行的操作,os.path.dirname(__file__)就是所执行的脚本文件对于当前所处的目录的相对路径,而os.getcwd()就是当前执行这个脚本所在的路径,即在哪个位置执行就是那个位置的路径。

2.有一些路径字符串中用的是”\”,正确的写法应该是”/”,因为当时是在windows上写的,没太注意。

github下载地址如下:下载地址

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python语言描述随机梯度下降法
Jan 04 Python
Python机器学习算法之k均值聚类(k-means)
Feb 23 Python
Python WSGI的深入理解
Aug 01 Python
Python参数解析模块sys、getopt、argparse使用与对比分析
Apr 02 Python
学习python分支结构
May 17 Python
python mqtt 客户端的实现代码实例
Sep 25 Python
基于python图像处理API的使用示例
Apr 03 Python
keras load model时出现Missing Layer错误的解决方式
Jun 11 Python
opencv 图像轮廓的实现示例
Jul 08 Python
无惧面试,带你搞懂python 装饰器
Aug 17 Python
Python hashlib和hmac模块使用方法解析
Dec 08 Python
python内置进制转换函数的操作
Jun 02 Python
使用coverage统计python web项目代码覆盖率的方法详解
Aug 05 #Python
基于python实现的百度新歌榜、热歌榜下载器(附代码)
Aug 05 #Python
selenium2.0中常用的python函数汇总
Aug 05 #Python
Django中使用CORS实现跨域请求过程解析
Aug 05 #Python
Flask使用Pyecharts在单个页面展示多个图表的方法
Aug 05 #Python
PyQt5基本控件使用详解:单选按钮、复选框、下拉框
Aug 05 #Python
用django设置session过期时间的方法解析
Aug 05 #Python
You might like
层叠菜单的动态生成
2006/10/09 PHP
php 分库分表hash算法
2009/11/12 PHP
ThinkPHP3.1新特性之动态设置自动完成和自动验证示例
2014/06/19 PHP
php中删除、清空session的方式总结
2015/10/09 PHP
完美利用Yii2微信后台开发的系列总结
2016/07/18 PHP
Laravel学习教程之View模块详解
2017/09/18 PHP
PHP实现求两个字符串最长公共子串的方法示例
2017/11/17 PHP
nodejs中使用monk访问mongodb
2014/07/06 NodeJs
JavaScript将数组转换成CSV格式的方法
2015/03/19 Javascript
jQuery中的deferred对象和extend方法详解
2017/05/08 jQuery
three.js加载obj模型的实例代码
2017/11/10 Javascript
jQuery使用动画队列自定义动画操作示例
2018/06/16 jQuery
微信小程序自定义单项选择器样式
2019/07/25 Javascript
layui实现数据表格点击搜索功能
2020/03/26 Javascript
js仿淘宝放大镜效果
2020/12/28 Javascript
[01:27:44]DOTA2-DPC中国联赛 正赛 PSG.LGD vs Aster BO3 第一场 1月24日
2021/03/11 DOTA
python 基础教程之Map使用方法
2017/01/17 Python
Python实现excel转sqlite的方法
2017/07/17 Python
无法使用pip命令安装python第三方库的原因及解决方法
2018/06/12 Python
Python 日志logging模块用法简单示例
2019/10/18 Python
Python 中如何实现参数化测试的方法示例
2019/12/10 Python
解决Python图形界面中设置尺寸的问题
2020/03/05 Python
python文件编写好后如何实践
2020/07/07 Python
服装设计专业毕业生推荐信
2013/11/09 职场文书
环保志愿者活动总结
2014/06/27 职场文书
2014年大学生职业规划书:未来不是梦,只要勇敢冲!
2014/09/22 职场文书
公务员四风问题对照检查材料整改措施
2014/09/26 职场文书
委托公证书样本
2015/01/23 职场文书
销售会议开幕词
2015/01/28 职场文书
2015年全民国防教育日活动总结
2015/03/23 职场文书
自我推荐信怎么写
2015/03/24 职场文书
给老婆的检讨书(搞笑版)
2015/05/06 职场文书
公司借条范本
2015/05/25 职场文书
初中思想品德教学反思
2016/02/24 职场文书
晚会开幕词范文
2016/03/04 职场文书
vue如何使用模拟的json数据查看效果
2022/03/31 Vue.js