基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python翻译软件实现代码(使用google api完成)
Nov 26 Python
Python学习笔记_数据排序方法
May 22 Python
Python实现的破解字符串找茬游戏算法示例
Sep 25 Python
Django 日志配置按日期滚动的方法
Jan 31 Python
为什么你还不懂得怎么使用Python协程
May 13 Python
Python 分发包中添加额外文件的方法
Aug 16 Python
Python 等分切分数据及规则命名的实例代码
Aug 16 Python
python 画出使用分类器得到的决策边界
Aug 21 Python
Python中使用threading.Event协调线程的运行详解
May 02 Python
Selenium元素定位的30种方式(史上最全)
May 11 Python
基于Python3读写INI配置文件过程解析
Jul 23 Python
Python3自带工具2to3.py 转换 Python2.x 代码到Python3的操作
Mar 03 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
php中mt_rand()随机数函数用法
2014/11/24 PHP
关于 Laravel Redis 多个进程同时取队列问题详解
2017/12/25 PHP
JS提交并解析后台返回的XML的代码
2008/11/03 Javascript
从零开始学习jQuery (八) 插播:jQuery实施方案
2011/02/23 Javascript
js报错 Object doesn't support this property or method的原因分析
2011/03/31 Javascript
JS+CSS设置img在DIV中只显示Img垂直居中的部分
2013/10/24 Javascript
详解Node.js如何开发命令行工具
2016/08/14 Javascript
Javascript从数组中随机取出不同元素的两种方法
2016/09/22 Javascript
微信小程序有旋转动画效果的音乐组件实例代码
2018/08/22 Javascript
详解vue-cli+es6引入es5写的js(两种方法)
2019/04/19 Javascript
element el-table表格的二次封装实现(附表格高度自适应)
2021/01/19 Javascript
python海龟绘图实例教程
2014/07/24 Python
Python生成随机密码
2015/03/10 Python
python写入中英文字符串到文件的方法
2015/05/06 Python
Python处理JSON数据并生成条形图
2016/08/05 Python
Python标准库之itertools库的使用方法
2017/09/07 Python
Python中用post、get方式提交数据的方法示例
2017/09/22 Python
Python模块搜索路径代码详解
2018/01/29 Python
TensorFlow实现AutoEncoder自编码器
2018/03/09 Python
Python实现时钟显示效果思路详解
2018/04/11 Python
python实现对图片进行旋转,放缩,裁剪的功能
2019/08/07 Python
pycharm永久激活超详细教程
2020/10/29 Python
非常漂亮的CSS3百叶窗焦点图动画
2016/02/24 HTML / CSS
Boda Skins皮衣官网:奢侈皮夹克,全球配送
2016/12/15 全球购物
台湾乐天市场:日本No.1的网路购物网站
2017/03/22 全球购物
幼教毕业生自我鉴定
2014/01/12 职场文书
2014的自我评价
2014/01/13 职场文书
国际会议邀请函范文
2014/01/16 职场文书
淘宝中秋节活动方案
2014/01/31 职场文书
国贸专业的职业规划书
2014/03/15 职场文书
班主任对学生的评语
2014/04/26 职场文书
委托书怎么写
2014/07/31 职场文书
感恩老师主题班会
2015/08/12 职场文书
自己搭建resnet18网络并加载torchvision自带权重的操作
2021/05/13 Python
Django migrate报错的解决方案
2021/05/20 Python
Nginx部署vue项目和配置代理的问题解析
2021/08/04 Servers