基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用实例分析Python中method的参数传递过程
Apr 02 Python
python随机生成指定长度密码的方法
Apr 04 Python
详解Python的Django框架中的Cookie相关处理
Jul 22 Python
12步教你理解Python装饰器
Feb 25 Python
python实现简单爬虫功能的示例
Oct 24 Python
python生成密码字典的方法
Jul 06 Python
Django使用paginator插件实现翻页功能的实例
Oct 24 Python
Python如何调用JS文件中的函数
Aug 16 Python
python用quad、dblquad实现一维二维积分的实例详解
Nov 20 Python
python 实现保存最新的三份文件,其余的都删掉
Dec 22 Python
windows python3安装Jupyter Notebooks教程
Apr 13 Python
python switch 实现多分支选择功能
Dec 21 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
将数组写入txt文件 var_export
2009/04/21 PHP
php中去除所有js,html,css代码
2010/10/12 PHP
IIS6.0中配置php服务全过程解析
2013/08/07 PHP
php中将一段数据存到一个txt文件中并显示其内容
2014/08/15 PHP
判断、添加和删除WordPress置顶文章的相关PHP函数小结
2015/12/10 PHP
PHP利用超级全局变量$_GET来接收表单数据的实例
2016/11/05 PHP
php的4种常用运行方式详解
2016/12/22 PHP
thinkphp中U方法按路由规则生成url的方法
2018/03/12 PHP
PHP中实现中文字串截取无乱码的解决方法
2018/05/29 PHP
javascript中对对层的控制
2006/12/29 Javascript
jQuery 页面 Mask实现代码
2010/01/09 Javascript
比Jquery的document.ready更快的方法
2010/04/28 Javascript
javascript oop开发滑动(slide)菜单控件
2010/08/25 Javascript
jQuery UI Datepicker length为空或不是对象错误的解决方法
2010/12/19 Javascript
利用CSS、JavaScript及Ajax实现高效的图片预加载
2013/10/16 Javascript
javascript常见用法总结
2014/05/22 Javascript
原生js实现class的添加和删除简单代码
2016/07/12 Javascript
使用jQuery Ajax 请求webservice来实现更简练的Ajax
2016/08/04 Javascript
关于ES6的六个小特性(二)
2017/02/20 Javascript
微信小程序实现刷脸登录
2018/05/25 Javascript
jquery.pagination.js分页使用教程
2018/10/23 jQuery
Vue.js实现可排序的表格组件功能示例
2019/02/19 Javascript
[57:29]Alliance vs KG 2019国际邀请赛小组赛 BO2 第二场 8.16
2019/08/17 DOTA
Python入门篇之数字
2014/10/20 Python
Python中类的定义、继承及使用对象实例详解
2015/04/30 Python
Python实现自动为照片添加日期并分类的方法
2017/09/30 Python
python通过paramiko复制远程文件及文件目录到本地
2019/04/30 Python
使用TensorFlow对图像进行随机旋转的实现示例
2020/01/20 Python
Python3 读取Word文件方式
2020/02/13 Python
python爬虫开发之使用Python爬虫库requests多线程抓取猫眼电影TOP100实例
2020/03/10 Python
Python3爬虫里关于Splash负载均衡配置详解
2020/07/10 Python
python实现学生信息管理系统(精简版)
2020/11/27 Python
html5利用canvas实现颜色容差抠图功能
2019/12/23 HTML / CSS
蔻驰英国官网:COACH英国
2020/07/19 全球购物
中学门卫岗位职责
2013/12/26 职场文书
一文了解Java动态代理的原理及实现
2022/07/07 Java/Android