Python爬取某平台短视频的方法


Posted in Python onFebruary 08, 2021

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

基本开发环境

Python 3.6

Pycharm

相关模块的使用

import os
import requests

安装Python并添加到环境变量,pip安装需要的相关模块即可。

一、确定需求

Python爬取某平台短视频的方法

爬取搞笑趣味栏目的视频内容。

二、网站数据分析

首先需要明确一点,好看视频网站加载方式是懒加载的方式,需要你下滑网页才会加载出新的内容

Python爬取某平台短视频的方法

加载出来的内容里面有音频播放地址以及标题。

内容比较简单,看代码就行

import os
import requests

url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
  'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = response.json()
videos = json_data['data']['response']['videos']
for index in videos:
  title = index['title']
  play_url = index['play_url']
  video_content = requests.get(url=play_url, headers=headers).content
  path = 'video\\'
  if not os.path.exists(path):
    os.mkdir(path)
  with open(path + title + '.mp4', mode='wb') as f:
    f.write(video_content)
    print('正在保存:', title)

Python爬取某平台短视频的方法

Python爬取某平台短视频的方法

到此这篇关于Python爬取某平台短视频的方法的文章就介绍到这了,更多相关Python爬取短视频内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
tornado框架blog模块分析与使用
Nov 21 Python
python抓取豆瓣图片并自动保存示例学习
Jan 10 Python
python中字典(Dictionary)用法实例详解
May 30 Python
python的格式化输出(format,%)实例详解
Jun 01 Python
pygame游戏之旅 添加游戏暂停功能
Nov 21 Python
Python版名片管理系统
Nov 30 Python
django框架用户权限中的session缓存到redis中的方法
Aug 06 Python
Python 合并多个TXT文件并统计词频的实现
Aug 23 Python
解决import tensorflow as tf 出错的原因
Apr 16 Python
如何使用Cython对python代码进行加密
Jul 08 Python
Python使用Selenium模拟浏览器自动操作功能
Sep 08 Python
python神经网络ResNet50模型
May 06 Python
利用Python批量识别电子账单数据的方法
Feb 08 #Python
Python命令行参数argv和argparse该如何使用
Feb 08 #Python
python 实现Requests发送带cookies的请求
Feb 08 #Python
PyCharm2020.3.2安装超详细教程
Feb 08 #Python
python 30行代码实现蚂蚁森林自动偷能量
Feb 08 #Python
如何用Python编写一个电子考勤系统
Feb 08 #Python
python编程的核心知识点总结
Feb 08 #Python
You might like
php+ajax制作无刷新留言板
2015/10/27 PHP
PHP中addcslashes与stripcslashes函数用法分析
2016/01/07 PHP
js获取电脑分辨率的思路及操作
2013/11/22 Javascript
PhotoShop给图片自动添加边框及EXIF信息的JS脚本
2015/02/15 Javascript
Treegrid的动态加载实例代码
2016/04/29 Javascript
基于zepto.js简单实现上传图片
2016/06/21 Javascript
JavaScript自动点击链接 防止绕过浏览器访问的方法
2017/01/19 Javascript
详解angular用$sce服务来过滤HTML标签
2017/04/11 Javascript
JavaScript实现读取与输出XML文件数据的方法示例
2018/06/05 Javascript
Vue数字输入框组件的使用方法
2019/10/19 Javascript
js实现星星打分效果
2020/07/05 Javascript
Vue实现穿梭框效果
2020/09/30 Javascript
Python的Tornado框架异步编程入门实例
2015/04/24 Python
Python基于pygame实现的font游戏字体(附源码)
2015/11/11 Python
python递归删除指定目录及其所有内容的方法
2017/01/13 Python
Django数据库表反向生成实例解析
2018/02/06 Python
python统计多维数组的行数和列数实例
2018/06/23 Python
pyqt5实现登录界面的模板
2020/05/30 Python
python 实现GUI(图形用户界面)编程详解
2019/07/17 Python
Django后台管理系统的图文使用教学
2020/01/20 Python
python GUI库图形界面开发之PyQt5计数器控件QSpinBox详细使用方法与实例
2020/02/28 Python
使用Django实现把两个模型类的数据聚合在一起
2020/03/28 Python
廉价航班、机票和酒店:JustFly
2018/02/07 全球购物
澳大利亚排名第一的在线酒类商店:MyBottleShop
2018/04/26 全球购物
波兰办公用品和学校用品在线商店:Dlabiura24.pl
2020/11/18 全球购物
是什么让J2EE适合用来开发多层的分布式的应用
2015/01/16 面试题
医学生职业规划范文
2014/01/05 职场文书
列车长先进事迹材料
2014/01/25 职场文书
《乌鸦和狐狸》教学反思
2014/02/08 职场文书
甜品店创业计划书
2014/09/21 职场文书
机关干部三严三实心得体会
2014/10/13 职场文书
党的群众路线教育实践活动个人对照检查材料(企业)
2014/11/05 职场文书
校园新闻稿范文
2015/07/18 职场文书
《我在为谁工作》:工作的质量往往决定生活的质量
2019/12/27 职场文书
python 远程执行命令的详细代码
2022/02/15 Python
MySQL 原理与优化之原数据锁的应用
2022/08/14 MySQL