Python爬取某平台短视频的方法


Posted in Python onFebruary 08, 2021

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

基本开发环境

Python 3.6

Pycharm

相关模块的使用

import os
import requests

安装Python并添加到环境变量,pip安装需要的相关模块即可。

一、确定需求

Python爬取某平台短视频的方法

爬取搞笑趣味栏目的视频内容。

二、网站数据分析

首先需要明确一点,好看视频网站加载方式是懒加载的方式,需要你下滑网页才会加载出新的内容

Python爬取某平台短视频的方法

加载出来的内容里面有音频播放地址以及标题。

内容比较简单,看代码就行

import os
import requests

url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
  'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = response.json()
videos = json_data['data']['response']['videos']
for index in videos:
  title = index['title']
  play_url = index['play_url']
  video_content = requests.get(url=play_url, headers=headers).content
  path = 'video\\'
  if not os.path.exists(path):
    os.mkdir(path)
  with open(path + title + '.mp4', mode='wb') as f:
    f.write(video_content)
    print('正在保存:', title)

Python爬取某平台短视频的方法

Python爬取某平台短视频的方法

到此这篇关于Python爬取某平台短视频的方法的文章就介绍到这了,更多相关Python爬取短视频内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python连接sql server乱码的解决方法
Jan 28 Python
Python程序中使用SQLAlchemy时出现乱码的解决方案
Apr 24 Python
Python处理JSON时的值报错及编码报错的两则解决实录
Jun 26 Python
Python内置函数——__import__ 的使用方法
Nov 24 Python
Python可迭代对象操作示例
May 07 Python
对Python中class和instance以及self的用法详解
Jun 26 Python
通过Python编写一个简单登录功能过程解析
Sep 04 Python
Python数据持久化存储实现方法分析
Dec 21 Python
Python中的 ansible 动态Inventory 脚本
Jan 19 Python
opencv-python的RGB与BGR互转方式
Jun 02 Python
Pytorch 高效使用GPU的操作
Jun 27 Python
Python 调用C++封装的进一步探索交流
Mar 04 Python
利用Python批量识别电子账单数据的方法
Feb 08 #Python
Python命令行参数argv和argparse该如何使用
Feb 08 #Python
python 实现Requests发送带cookies的请求
Feb 08 #Python
PyCharm2020.3.2安装超详细教程
Feb 08 #Python
python 30行代码实现蚂蚁森林自动偷能量
Feb 08 #Python
如何用Python编写一个电子考勤系统
Feb 08 #Python
python编程的核心知识点总结
Feb 08 #Python
You might like
PHP 在5.1.* 和5.2.*之间 PDO数据库操作中的不同之处小结
2012/03/07 PHP
解析zend Framework如何自动加载类
2013/06/28 PHP
如何阻止网站被恶意反向代理访问(防网站镜像)
2014/03/18 PHP
php单元测试phpunit入门实例教程
2017/11/17 PHP
PHP获取HTTP body内容的方法
2018/12/31 PHP
一段好玩的JavaScript代码
2006/12/01 Javascript
document.getElementById为空或不是对象的解决方法
2010/01/24 Javascript
8个超棒的学习 jQuery 的网站 推荐收藏
2011/04/02 Javascript
jquery 卷帘效果实现代码(不同方向)
2013/02/05 Javascript
jQuery 全选/反选以及单击行改变背景色实例
2013/07/02 Javascript
Tab切换组件(选项卡功能)实例代码
2013/11/21 Javascript
JavaScript中的函数重载深入理解
2014/08/04 Javascript
node.js中的fs.closeSync方法使用说明
2014/12/17 Javascript
js实现新浪微博首页效果
2015/10/16 Javascript
整理Javascript数组学习笔记
2015/11/29 Javascript
浅析BootStrap Treeview的简单使用
2016/10/12 Javascript
jQuery的中 is(':visible') 解析及用法(必看)
2017/02/12 Javascript
vue-cli 使用vue-bus来全局控制的实例讲解
2018/09/15 Javascript
react写一个select组件的实现代码
2019/04/03 Javascript
详解ECMAScript2019/ES10新属性
2019/12/06 Javascript
JS模拟实现京东快递单号查询
2020/11/30 Javascript
python回溯法实现数组全排列输出实例分析
2015/03/17 Python
python安装教程
2018/02/28 Python
python数字图像处理之骨架提取与分水岭算法
2018/04/27 Python
Python数据类型之Number数字操作实例详解
2019/05/08 Python
Ubuntu18.04下python版本完美切换的解决方法
2019/06/14 Python
django-rest-framework解析请求参数过程详解
2019/07/18 Python
Python面向对象程序设计之私有变量,私有方法原理与用法分析
2020/03/23 Python
如何基于pandas读取csv后合并两个股票
2020/09/25 Python
wedgwood加拿大官网:1759年成立的英国国宝级陶瓷餐具品牌
2018/07/17 全球购物
哈萨克斯坦最大的时装、鞋子和配饰在线商店:Lamoda.kz
2019/11/19 全球购物
应届毕业生求职自荐书
2014/01/03 职场文书
大学生迟到检讨书500字
2014/10/17 职场文书
综治工作汇报材料
2014/10/27 职场文书
职工食堂管理制度
2015/08/06 职场文书
2019年大学推荐信
2019/06/24 职场文书