基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python ElementTree 基本读操作示例
Apr 09 Python
可用于监控 mysql Master Slave 状态的python代码
Feb 10 Python
python中函数默认值使用注意点详解
Jun 01 Python
Python中super函数的用法
Nov 17 Python
浅谈Python3中strip()、lstrip()、rstrip()用法详解
Apr 29 Python
调试Django时打印SQL语句的日志代码实例
Sep 12 Python
Python 类方法和实例方法(@classmethod),静态方法(@staticmethod)原理与用法分析
Sep 20 Python
python生成器用法实例详解
Nov 22 Python
使用Python实现Wake On Lan远程开机功能
Jan 22 Python
Python3中的f-Strings增强版字符串格式化方法
Mar 04 Python
Python自动发送和收取邮件的方法
Aug 12 Python
Python import模块的缓存问题解决方案
Jun 02 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
用PHP实现小型站点广告管理(修正版)
2006/10/09 PHP
PHP类中的魔术方法(Magic Method)简明总结
2014/07/08 PHP
ThinkPHP中pathinfo的访问模式、路径访问模式及URL重写总结
2014/08/23 PHP
解析WordPress中函数钩子hook的作用及基本用法
2015/12/22 PHP
php下载文件超时时间的设置方法
2016/10/06 PHP
php实现给二维数组中所有一维数组添加值的方法
2017/02/04 PHP
PHP 实现重载
2021/03/09 PHP
JS回调函数的应用简单实例
2014/09/17 Javascript
nodejs中简单实现Javascript Promise机制的实例
2014/12/06 NodeJs
jQuery实现图片渐入渐出切换展示效果
2015/08/15 Javascript
jQuery版本升级踩坑大全
2016/01/12 Javascript
Bootstrap进度条组件知识详解
2016/05/01 Javascript
使用JS代码实现点击按钮下载文件
2016/11/12 Javascript
微信小程序开发之选项卡(窗口底部TabBar)页面切换
2017/04/12 Javascript
十个免费的web前端开发工具详细整理
2017/09/18 Javascript
layui--select使用以及下拉框实现键盘选择的例子
2019/09/24 Javascript
JS实现普通轮播图特效
2020/01/01 Javascript
Vue的双向数据绑定实现原理解析
2020/02/17 Javascript
JavaScript缓动动画函数的封装方法
2020/11/25 Javascript
python kmeans聚类简单介绍和实现代码
2018/02/23 Python
Python RabbitMQ消息队列实现rpc
2018/05/30 Python
详解Python文件修改的两种方式
2019/08/22 Python
CSS3制作圆形滚动进度条动画的示例
2020/11/05 HTML / CSS
Html5 滚动穿透的方法
2019/05/13 HTML / CSS
英国电子产品购物网站:Tech in the basket
2019/11/08 全球购物
环境工程大学生自荐信
2013/10/21 职场文书
英语一分钟演讲稿
2014/04/29 职场文书
党员先锋岗事迹材料
2014/05/08 职场文书
青春励志演讲稿范文
2014/08/25 职场文书
2014小学教师年度考核工作总结
2014/12/03 职场文书
伏羲庙导游词
2015/02/09 职场文书
2015年公务员工作总结
2015/04/24 职场文书
贷款收入证明范本
2015/06/12 职场文书
mysql分组后合并显示一个字段的多条数据方式
2022/01/22 MySQL
Python识别花卉种类鉴定网络热门植物并自动整理分类
2022/04/08 Python
Ruby序列化和持久化存储 Marshal和Pstore介绍
2022/04/18 Ruby