基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现二分法算法实例
Feb 02 Python
Python实现简单的语音识别系统
Dec 13 Python
Python编程求质数实例代码
Jan 31 Python
Python实现简单求解给定整数的质因数算法示例
Mar 25 Python
python检测主机的连通性并记录到文件的实例
Jun 21 Python
python将list转为matrix的方法
Dec 12 Python
python实现布隆过滤器及原理解析
Dec 08 Python
Windows系统下pycharm中的pip换源
Feb 23 Python
Python 之 Json序列化嵌套类方式
Feb 27 Python
Python unittest如何生成HTMLTestRunner模块
Sep 08 Python
Python爬虫框架之Scrapy中Spider的用法
Jun 28 Python
Python万能模板案例之matplotlib绘制直方图的基本配置
Apr 13 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
Laravel如何自定义command命令浅析
2019/03/23 PHP
jquery 事件执行检测代码
2009/12/09 Javascript
自己写的兼容ie和ff的在线文本编辑器类似ewebeditor
2012/12/12 Javascript
js相册效果代码(点击创建即可)
2013/04/16 Javascript
JavaScript的模块化:封装(闭包),继承(原型) 介绍
2013/07/22 Javascript
原生javascript实现匀速运动动画效果
2016/02/26 Javascript
页面向下滚动ajax获取数据的实现方法(兼容手机)
2016/05/24 Javascript
微信小程序左滑删除效果的实现代码
2017/02/20 Javascript
JS实现的集合去重,交集,并集,差集功能示例
2018/03/13 Javascript
详解webpack模块化管理和打包工具
2018/04/21 Javascript
vue实现个人信息查看和密码修改功能
2018/05/06 Javascript
微信小程序如何获取手机验证码
2018/11/04 Javascript
vue路由导航守卫和请求拦截以及基于node的token认证的方法
2019/04/07 Javascript
JS开发自己的类库实例分析
2019/08/28 Javascript
vue结合el-upload实现腾讯云视频上传功能
2020/07/01 Javascript
[02:12]DOTA2英雄基础教程 变体精灵
2013/12/16 DOTA
[01:18:36]LGD vs VP Supermajor 败者组决赛 BO3 第一场 6.10
2018/07/04 DOTA
python备份文件的脚本
2008/08/11 Python
Python中的id()函数指的什么
2017/10/17 Python
python opencv实现任意角度的透视变换实例代码
2018/01/12 Python
python修改list中所有元素类型的三种方法
2018/04/09 Python
基于sklearn实现Bagging算法(python)
2019/07/11 Python
Python imread、newaxis用法详解
2019/11/04 Python
Python txt文件如何转换成字典
2020/11/03 Python
python切割图片的示例
2020/11/12 Python
HTML5 Canvas入门学习教程
2016/03/17 HTML / CSS
Finishline官网:美国一家领先的运动品牌鞋类、服装零售商
2016/07/20 全球购物
美国最大的网络男装服装品牌:Bonobos
2017/05/25 全球购物
Anya Hindmarch官网:奢侈设计师手袋及配饰
2018/11/15 全球购物
读群众路线的心得体会
2014/09/03 职场文书
婚前协议书范本
2014/10/27 职场文书
2014年餐厅服务员工作总结
2014/11/18 职场文书
关爱空巢老人感想
2015/08/11 职场文书
Jupyter Notebook 如何修改字体和大小以及更改字体样式
2021/06/03 Python
使用springMVC所需要的pom配置
2021/09/15 Java/Android
MySQL去除密码登录告警的方法
2022/04/20 MySQL