基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python之PyUnit单元测试实例
Oct 11 Python
Python中list列表的一些进阶使用方法介绍
Aug 15 Python
Python简单实现子网掩码转换的方法
Apr 13 Python
Python读取指定目录下指定后缀文件并保存为docx
Apr 23 Python
Django视图之ORM数据库查询操作API的实例
Oct 27 Python
深入理解Python中range和xrange的区别
Nov 26 Python
django admin 后台实现三级联动的示例代码
Jun 22 Python
Appium+Python自动化测试之运行App程序示例
Jan 23 Python
python实现可变变量名方法详解
Jul 01 Python
春节到了 教你使用python来抢票回家
Jan 06 Python
python 实现rolling和apply函数的向下取值操作
Jun 08 Python
超详细Python解释器新手安装教程
May 10 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
我的论坛源代码(七)
2006/10/09 PHP
php更改目录及子目录下所有的文件后缀扩展名的代码
2010/10/12 PHP
PHP操作XML作为数据库的类
2010/12/19 PHP
php扩展开发入门demo示例
2019/09/23 PHP
短信提示使用 特效
2007/01/19 Javascript
键盘上一张下一张兼容IE/google/firefox等浏览器
2014/01/28 Javascript
JavaScript实现的购物车效果可以运用在好多地方
2014/05/09 Javascript
js获取日期:昨天今天和明天、后天
2014/06/11 Javascript
js+jquery实现图片裁剪功能
2015/01/02 Javascript
JavaScript的原型继承详解
2015/02/15 Javascript
浅谈使用MVC模式进行JavaScript程序开发
2015/11/10 Javascript
Node.js中Request模块处理HTTP协议请求的基本使用教程
2016/03/31 Javascript
jquery点击改变class并toggle的实现代码
2016/05/15 Javascript
JS实现数组去重复值的方法示例
2017/02/18 Javascript
jQuery插件HighCharts实现的2D条状图效果示例【附demo源码下载】
2017/03/15 Javascript
利用js查找数组中指定元素并返回该元素的所有索引示例
2017/03/29 Javascript
微信小程序实现美团菜单
2018/06/06 Javascript
解决layui中table异步数据请求不支持自定义返回数据格式的问题
2018/08/19 Javascript
微信小程序基于ColorUI构建皮皮虾短视频去水印组件
2020/11/04 Javascript
python3简单实现微信爬虫
2015/04/09 Python
Django中传递参数到URLconf的视图函数中的方法
2015/07/18 Python
python dict 字典 以及 赋值 引用的一些实例(详解)
2017/01/20 Python
Python 和 JS 有哪些相同之处
2017/11/23 Python
numpy中实现二维数组按照某列、某行排序的方法
2018/04/04 Python
对命令行模式与python交互模式介绍
2018/05/12 Python
python微信公众号之关注公众号自动回复
2018/10/25 Python
将tensorflow.Variable中的某些元素取出组成一个新的矩阵示例
2020/01/04 Python
Keras构建神经网络踩坑(解决model.predict预测值全为0.0的问题)
2020/07/07 Python
python 如何使用find和find_all爬虫、找文本的实现
2020/10/16 Python
html5+CSS3+JS实现七夕言情功能代码
2017/08/28 HTML / CSS
墨尔本最受欢迎的复古风格品牌:Princess Highway
2018/12/21 全球购物
员工手册董事长致辞
2015/07/29 职场文书
感恩的心主题班会
2015/08/12 职场文书
同学聚会开幕词
2019/04/02 职场文书
你离财务总监还有多远?速览CFO的岗位职责
2019/11/18 职场文书
Python使用MapReduce进行简单的销售统计
2022/04/22 Python