基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python快速查找算法应用实例
Sep 26 Python
在Python的Django框架中生成CSV文件的方法
Jul 22 Python
解决Django模板无法使用perms变量问题的方法
Sep 10 Python
python实现判断一个字符串是否是合法IP地址的示例
Jun 04 Python
对python的bytes类型数据split分割切片方法
Dec 04 Python
解决python中无法自动补全代码的问题
Dec 04 Python
python将txt文档每行内容循环插入数据库的方法
Dec 28 Python
python实现Excel文件转换为TXT文件
Apr 28 Python
Python 用matplotlib画以时间日期为x轴的图像
Aug 06 Python
python-视频分帧&多帧合成视频实例
Dec 10 Python
基于python检查矩阵计算结果
May 21 Python
python入门:argparse浅析 nargs='+'作用
Jul 12 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
php实现字符串翻转的方法
2015/03/27 PHP
php按字符无乱码截取中文的方法
2015/03/27 PHP
PHP的Laravel框架结合MySQL与Redis数据库的使用部署
2016/03/21 PHP
PHP实现json_decode不转义中文的方法
2017/05/20 PHP
深入理解Yii2.0乐观锁与悲观锁的原理与使用
2017/07/26 PHP
PHP 中魔术常量的实例详解
2017/10/26 PHP
Laravel timestamps 设置为unix时间戳的方法
2019/10/11 PHP
JQuery中操作Css样式的方法
2014/02/12 Javascript
js识别不同浏览器基于userAgent做判断
2014/07/29 Javascript
JavaScript fontcolor方法入门实例(按照指定的颜色来显示字符串)
2014/10/17 Javascript
JavaScript操作cookie类实例
2015/03/31 Javascript
javascript中利用柯里化函数实现bind方法【推荐】
2016/04/29 Javascript
js enter键激发事件实例代码
2016/08/17 Javascript
详解百度百科目录导航树小插件
2017/01/08 Javascript
基于BootStrap multiselect.js实现的下拉框联动效果
2017/07/28 Javascript
vue.js自定义组件directives的实例代码
2018/11/09 Javascript
详解axios中封装使用、拦截特定请求、判断所有请求加载完毕)
2019/04/09 Javascript
Vue的双向数据绑定实现原理解析
2020/02/17 Javascript
VUE+elementui组件在table-cell单元格中绘制微型echarts图
2020/04/20 Javascript
Python实现获取操作系统版本信息方法
2015/04/08 Python
Python中类型检查的详细介绍
2017/02/13 Python
Python图片转换成矩阵,矩阵数据转换成图片的实例
2018/07/02 Python
pycharm执行python时,填写参数的方法
2018/10/29 Python
用Python抢火车票的简单小程序实现解析
2019/08/14 Python
CSS3 2D模拟实现摩天轮旋转效果
2016/11/16 HTML / CSS
中国跨境电子商务网站:NewFrog
2018/03/10 全球购物
英国在线定做百叶窗网站:Make My Blinds
2020/08/17 全球购物
商务日语毕业生自荐信
2013/11/23 职场文书
大宝sod蜜广告词
2014/03/21 职场文书
品质标语大全
2014/06/21 职场文书
行政求职信
2014/07/04 职场文书
大学生上课迟到检讨书
2014/10/15 职场文书
致800米运动员广播稿(10篇)
2014/10/17 职场文书
解决Jupyter-notebook不弹出默认浏览器的问题
2021/03/30 Python
Python+Selenium实现抖音、快手、B站、小红书、微视、百度好看视频、西瓜视频、微信视频号、搜狐视频、一点号、大风号、趣头条等短视频自动发布
2022/04/13 Python
关于Redis的主从复制及哨兵问题
2022/06/16 Redis