Python爬取某平台短视频的方法


Posted in Python onFebruary 08, 2021

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

基本开发环境

Python 3.6

Pycharm

相关模块的使用

import os
import requests

安装Python并添加到环境变量,pip安装需要的相关模块即可。

一、确定需求

Python爬取某平台短视频的方法

爬取搞笑趣味栏目的视频内容。

二、网站数据分析

首先需要明确一点,好看视频网站加载方式是懒加载的方式,需要你下滑网页才会加载出新的内容

Python爬取某平台短视频的方法

加载出来的内容里面有音频播放地址以及标题。

内容比较简单,看代码就行

import os
import requests

url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
  'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = response.json()
videos = json_data['data']['response']['videos']
for index in videos:
  title = index['title']
  play_url = index['play_url']
  video_content = requests.get(url=play_url, headers=headers).content
  path = 'video\\'
  if not os.path.exists(path):
    os.mkdir(path)
  with open(path + title + '.mp4', mode='wb') as f:
    f.write(video_content)
    print('正在保存:', title)

Python爬取某平台短视频的方法

Python爬取某平台短视频的方法

到此这篇关于Python爬取某平台短视频的方法的文章就介绍到这了,更多相关Python爬取短视频内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
详解Python中的join()函数的用法
Apr 07 Python
Python制作简单的网页爬虫
Nov 22 Python
Python中列表元素转为数字的方法分析
Jun 14 Python
python爬取w3shcool的JQuery课程并且保存到本地
Apr 06 Python
Python3 实现随机生成一组不重复数并按行写入文件
Apr 09 Python
用TensorFlow实现戴明回归算法的示例
May 02 Python
Python面向对象程序设计示例小结
Jan 30 Python
Python正则表达式和re库知识点总结
Feb 11 Python
python实现二维数组的对角线遍历
Mar 02 Python
Windows下Pycharm远程连接虚拟机中Centos下的Python环境(图文教程详解)
Mar 19 Python
关于Python 解决Python3.9 pandas.read_excel(‘xxx.xlsx‘)报错的问题
Nov 28 Python
 Python 中 logging 模块使用详情
Mar 03 Python
利用Python批量识别电子账单数据的方法
Feb 08 #Python
Python命令行参数argv和argparse该如何使用
Feb 08 #Python
python 实现Requests发送带cookies的请求
Feb 08 #Python
PyCharm2020.3.2安装超详细教程
Feb 08 #Python
python 30行代码实现蚂蚁森林自动偷能量
Feb 08 #Python
如何用Python编写一个电子考勤系统
Feb 08 #Python
python编程的核心知识点总结
Feb 08 #Python
You might like
Ajax+PHP边学边练 之五 图片处理
2009/12/03 PHP
在PHP语言中使用JSON和将json还原成数组的方法
2016/07/19 PHP
php实现多维数组排序的方法示例
2017/03/23 PHP
一些有关检查数据的JS代码
2006/09/07 Javascript
javascript里的条件判断
2007/02/27 Javascript
打造基于jQuery的高性能TreeView(asp.net)
2011/02/23 Javascript
JavaScript之自定义类型
2012/05/04 Javascript
使用js写的一个简易的投票
2013/11/27 Javascript
JS+CSS实现带关闭按钮DIV弹出窗口的方法
2015/02/27 Javascript
基于jQuery.validate及Bootstrap的tooltip开发气泡样式的表单校验组件思路详解
2016/07/18 Javascript
使用bootstrap实现多窗口和拖动效果
2016/09/22 Javascript
jQuery右下角悬浮广告实例
2016/10/17 Javascript
Sortable.js拖拽排序使用方法解析
2016/11/04 Javascript
js实现多张图片延迟加载效果
2017/07/17 Javascript
Vue利用History记录上一页面的数据方法实例
2018/11/02 Javascript
layui动态渲染生成左侧3级菜单的方法(根据后台返回数据)
2019/09/23 Javascript
Nuxt 嵌套路由nuxt-child组件用法(父子页面组件的传值)
2020/11/05 Javascript
[05:43]VG.R战队教练Mikasa专访:为目标从未停止战斗
2016/08/02 DOTA
Python 26进制计算实现方法
2015/05/28 Python
Python的math模块中的常用数学函数整理
2016/02/04 Python
Python编程中对super函数的正确理解和用法解析
2016/07/02 Python
安装python时MySQLdb报错的问题描述及解决方法
2018/03/20 Python
对Python中gensim库word2vec的使用详解
2018/05/08 Python
python dlib人脸识别代码实例
2019/04/04 Python
pytorch程序异常后删除占用的显存操作
2020/01/13 Python
CSS3 Media Queries详细介绍和使用实例
2014/05/08 HTML / CSS
CSS3自定义滚动条样式的示例代码
2017/08/21 HTML / CSS
工程力学硕士生的自我评价范文
2013/11/16 职场文书
学习交流会主持词
2014/04/01 职场文书
星级党支部申报材料
2014/05/31 职场文书
财务会计专业求职信
2014/06/09 职场文书
初中生散播谣言检讨书
2014/11/17 职场文书
2014年信贷员工作总结
2014/11/18 职场文书
公司董事任命书
2015/09/21 职场文书
JS高级程序设计之class继承重点详解
2022/07/07 Javascript
MySQL实现用逗号进行拼接、以逗号进行分割
2022/12/24 MySQL