基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python正规则表达式学习指南
Aug 02 Python
pandas中Timestamp类用法详解
Dec 11 Python
python 通过SSHTunnelForwarder隧道连接redis的方法
Feb 19 Python
python实现两个dict合并与计算操作示例
Jul 01 Python
对python中的*args与**kwgs的含义与作用详解
Aug 28 Python
python3实现在二叉树中找出和为某一值的所有路径(推荐)
Dec 26 Python
Python 实现加密过的PDF文件转WORD格式
Feb 04 Python
Python pip配置国内源的方法
Feb 14 Python
django使用JWT保存用户登录信息
Apr 22 Python
如何理解python中数字列表
May 29 Python
Python面向对象多态实现原理及代码实例
Sep 16 Python
记一次Django响应超慢的解决过程
Sep 17 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
PHP新手上路(九)
2006/10/09 PHP
一个php导出oracle库的php代码
2009/04/20 PHP
php程序之die调试法 快速解决错误
2009/09/17 PHP
PHP编程之设置apache虚拟目录
2016/07/08 PHP
PHP 信号管理知识整理汇总
2017/02/19 PHP
php中访问修饰符的知识点总结
2019/01/27 PHP
javascript编程起步(第四课)
2007/02/27 Javascript
理解JSON:3分钟课程
2011/10/28 Javascript
js验证输入是否为手机号码或电话号码示例
2013/12/30 Javascript
js获取当前页面路径示例讲解
2014/01/08 Javascript
jQuery同步提交示例代码
2015/12/12 Javascript
Bootstrap网格系统详解
2016/04/26 Javascript
深入理解JS addLoadEvent函数
2016/05/20 Javascript
jquery动态创建div与input的实例代码
2016/10/12 Javascript
JS函数修改html的元素内容,及修改属性内容的方法
2016/10/28 Javascript
用Vue.extend构建消息提示组件的方法实例
2017/08/08 Javascript
微信小程序实现弹出菜单动画
2019/06/21 Javascript
Vue打包部署到Nginx时,css样式不生效的解决方式
2020/08/03 Javascript
Django项目实战之用户头像上传与访问的示例
2018/04/21 Python
tensorflow: variable的值与variable.read_value()的值区别详解
2018/07/30 Python
Django添加sitemap的方法示例
2018/08/06 Python
PyCharm 创建指定版本的 Django(超详图解教程)
2019/06/18 Python
详解Python3 pandas.merge用法
2019/09/05 Python
Python 获取numpy.array索引值的实例
2019/12/06 Python
pip安装tensorflow的坑的解决
2020/04/19 Python
Python 创建守护进程的示例
2020/09/29 Python
利用python+ffmpeg合并B站视频及格式转换的实例代码
2020/11/24 Python
专业幼师实习生自我鉴定范文
2013/12/08 职场文书
财务主管的岗位职责
2013/12/30 职场文书
工作说明书范文
2014/05/07 职场文书
欢迎新生标语
2014/10/06 职场文书
节约用电倡议书
2015/04/28 职场文书
幼儿园端午节活动总结
2015/05/05 职场文书
道歉短信大全
2015/05/12 职场文书
会议承办单位欢迎词
2019/07/09 职场文书
mysql数据库如何转移到oracle
2022/12/24 MySQL