编程 Python

Python通过m3u8文件下载合并ts视频的操作

Posted in Python onApril 16, 2021

前段时间，接到一个需求，要求下载某一个网站的视频，然后自己从网上查阅了相关的资料，在这里做一个总结。

1. m3u8文件

m3u8是苹果公司推出一种视频播放标准，是一种文件检索格式，将视频切割成一小段一小段的ts格式的视频文件，然后存在服务器中（现在为了减少I/o访问次数，一般存在服务器的内存中），通过m3u8解析出来路径，然后去请求，是现在比较流行的一种加载方式。目前，很多新闻视频网站都是采用这种模式去加载视频。

M3U8文件是指UTF-8编码格式的M3U文件。M3U文件是记录了一个索引纯文本文件，打开它时播放软件并不是播放它，而是根据它的索引找到对应的音视频文件的网络地址进行在线播放。原视频数据分割为很多个TS流，每个TS流的地址记录在m3u8文件列表中。

下面就是m3u8文件的格式。

#EXTM3U
#EXT-X-VERSION:3
#EXT-X-MEDIA-SEQUENCE:0
#EXT-X-ALLOW-CACHE:YES
#EXT-X-TARGETDURATION:15
#EXTINF:6.916667,
out000.ts
#EXTINF:10.416667,
out001.ts
#EXTINF:10.416667,
out002.ts
#EXTINF:1.375000,
out003.ts
#EXTINF:1.541667,
out004.ts
#EXTINF:7.666667,
out005.ts
#EXTINF:10.416667,

2. ts文件处理

只有m3u8文件，需要下载ts文件

ts文件能正常播放，但太多而小，需要合并有ts文件

但因为被加密无法播放，需要解码

在这里我只记录下前两个步骤，因为，我目前研究的比较少，还没有遇到ts被加密的情况。

3. 分析举例

那么下面，我就正式举一个网站，第一财经网（直接点击）跟大家正式的讲解下。

这是该网站的视频。如下图：

Python通过m3u8文件下载合并ts视频的操作

点击第一个视频，这就是我们这次要爬取的视频。

Python通过m3u8文件下载合并ts视频的操作

然后鼠标右键点击，选择"检查" 或者按F12键，进入开发者模式，查看网页代码。

然后，点击Network ，再点击other，寻找请求地址中带有m3u8和ts标记的请求地址。

不懂，请看下图。有一点，很重要。网站通过切割后ts加载视频，并不是没有规律的，而是通过m3u8文件附带的。也就说，网站一定是先加载m3u8文件，然后根据m3u8文件，去请求ts文件。所以，如果你找不到m3u8文件的话，你可以先找第一个ts文件，然后往上面翻，一定能找到m3u8文件。

Python通过m3u8文件下载合并ts视频的操作

再点击这个m3u8文件，右侧对应的就是它的请求地址。

Python通过m3u8文件下载合并ts视频的操作

请求地址如下：

https://ycalvod.yicai.com/record/live/cbn/ca233887-1443-4bdf-b762-3b4b3a217085_LD.m3u8?auth_key=1575703722-0-0-6f09e9a156491f027a035e31c238c48c&ycfrom=yicaiwww

你可以把上面那个地址，输入浏览器地址框内，下载下来。也可以通过查看源码，找到该功能的对应的html代码。

这是下载下来的m3u8文件。

Python通过m3u8文件下载合并ts视频的操作

从图片可以看出来，每一个ts文件都是相对的地址，所以下面我们就需要找到绝对地址。

Python通过m3u8文件下载合并ts视频的操作

ts文件地址如下：

https://ycalvod.yicai.com/record/live/cbn_yld/1575111614_3446078.ts

上面，我们已经把这个网站的视频加载模式分析的很透彻，下面就开始撸代码了。

4. 获取ts文件

def getTsUrl():
    ts_url_list = []
    baseUrl = "https://ycalvod.yicai.com/record/live"
    with open("ca233887-1443-4bdf-b762-3b4b3a217085_LD.m3u8", "r", encoding="utf-8") as f:
        m3u8Contents = f.readlines()
        for content in m3u8Contents:
            if content.endswith("ts\n"):
                ts_Url = baseUrl + content.replace("\n", "").replace("..", "")
                ts_url_list.append(ts_Url)
                print(ts_Url)
    return ts_url_list

5. 下载ts文件

def download_ts_video(download_path, ts_url_list):
    download_path = r"C:\Users\Administrator\Desktop\AiShu\下载视频\TS视频"
    for i in range(len(ts_url_list)):
        ts_url = ts_url_list[i]
        try:
            response = requests.get(ts_url, stream=True, verify=False)
        except Exception as e:
            print("异常请求：%s" % e.args)
            return
        ts_path = download_path + "\{}.ts".format(i)
        with open(ts_path, "wb+") as file:
            for chunk in response.iter_content(chunk_size=1024):
                if chunk:
                    file.write(chunk)
    print("TS文件下载完毕！！")

这就是我本地下载好的ts切割视频

Python通过m3u8文件下载合并ts视频的操作

6. 合并TS视频

def heBingTsVideo(download_path,hebing_path):
    all_ts = os.listdir(download_path)
    with open(hebing_path, 'wb+') as f:
        for i in range(len(all_ts)):
            ts_video_path = os.path.join(download_path, all_ts[i])
            f.write(open(ts_video_path, 'rb').read())
    print("合并完成！！")

最后的结果如下：

Python通过m3u8文件下载合并ts视频的操作

7. 完整的代码

有兴趣的小伙伴，可以研究下。

import requests,os
def getTsUrl():
    ts_url_list = []
    baseUrl = "https://ycalvod.yicai.com/record/live"
    with open("ca233887-1443-4bdf-b762-3b4b3a217085_LD.m3u8", "r", encoding="utf-8") as f:
        m3u8Contents = f.readlines()
        for content in m3u8Contents:
            if content.endswith("ts\n"):
                ts_Url = baseUrl + content.replace("\n", "").replace("..", "")
                ts_url_list.append(ts_Url)
                print(ts_Url)
    return ts_url_list
def download_ts_video(download_path, ts_url_list):
    download_path = r"C:\Users\Administrator\Desktop\AiShu\下载视频\TS视频"
    for i in range(len(ts_url_list)):
        ts_url = ts_url_list[i]
        try:
            response = requests.get(ts_url, stream=True, verify=False)
        except Exception as e:
            print("异常请求：%s" % e.args)
            return
        ts_path = download_path + "\{}.ts".format(i)
        with open(ts_path, "wb+") as file:
            for chunk in response.iter_content(chunk_size=1024):
                if chunk:
                    file.write(chunk)
    print("TS文件下载完毕！！")
def heBingTsVideo(download_path,hebing_path):
    all_ts = os.listdir(download_path)
    with open(hebing_path, 'wb+') as f:
        for i in range(len(all_ts)):
            ts_video_path = os.path.join(download_path, all_ts[i])
            f.write(open(ts_video_path, 'rb').read())
    print("合并完成！！")
if __name__ == '__main__':
    download_path = r"C:\Users\Administrator\Desktop\AiShu\下载视频\TS视频"
    hebing_path = r"C:\Users\Administrator\Desktop\AiShu\下载视频\合并TS视频\第一财经.mp4"
    ts_url_list = getTsUrl()
    download_ts_video(download_path, ts_url_list)
    heBingTsVideo(download_path,hebing_path)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持三水点靠木。如有错误或未考虑完全的地方，望不吝赐教。

Python通过m3u8文件下载合并ts视频的操作

- Author -

SpiderLiH

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python里disconnect UDP套接字的方法

Apr 23 Python

python实现将html表格转换成CSV文件的方法

Jun 28 Python

Python实现的三层BP神经网络算法示例

Feb 07 Python

使用Python爬了4400条淘宝商品数据,竟发现了这些“潜规则”

Mar 23 Python

Python爬虫实现（伪）球迷速成

Jun 10 Python

python3实现点餐系统

Jan 24 Python

python读取csv和txt数据转换成向量的实例

Feb 12 Python

解决python中导入win32com.client出错的问题

Jul 26 Python

python matplotlib折线图样式实现过程

Nov 04 Python

python实现飞机大战小游戏

Nov 08 Python

如何使用python切换hosts文件

Apr 29 Python

Python编程根据字典列表相同键的值进行合并

Oct 05 Python

Python实现Telnet自动连接检测密码的示例

AI:如何训练机器学习的模型

python 用递归实现通用爬虫解析器

MATLAB 如何求取离散点的曲率最大值

用Python远程登陆服务器的步骤

Matlab求解数组中的最大值及它所在的具体位置

Apr 16 #Python

python 机器学习的标准化、归一化、正则化、离散化和白化

Apr 16 #Python

You might like

phpBB BBcode处理的漏洞

2006/10/09 PHP

通过缓存数据库结果提高PHP性能的原理介绍

2012/09/05 PHP

Laravel学习基础之migrate的使用教程

2017/10/11 PHP

javascript html 静态页面传参数

2009/04/10 Javascript

jQuery(1.3.2) 7行代码搞定跟随屏幕滚动的层

2009/05/21 Javascript

浅谈javascript 面向对象编程

2009/10/28 Javascript

javascript ie6兼容position:fixed实现思路

2013/04/01 Javascript

JavaScript中为什么null==0为false而null大于=0为true(个人研究)

2013/09/16 Javascript

JS表的模拟方法

2015/02/05 Javascript

Express实现前端后端通信上传图片之存储数据库（mysql）傻瓜式教程（一）

2015/12/10 Javascript

深入理解JS中的substr和substring

2016/04/26 Javascript

JavaScript实现的选择排序算法实例分析

2017/04/14 Javascript

three.js中文文档学习之通过模块导入

2017/11/20 Javascript

node.js支持多用户web终端实现及安全方案

2017/11/29 Javascript

JS代码实现电脑配置检测功能

2018/03/21 Javascript

详解vue 在移动端体验上的优化解决方案

2019/05/20 Javascript

Python isinstance函数介绍

2015/04/14 Python

python pandas dataframe 按列或者按行合并的方法

2018/04/12 Python

python实战教程之自动扫雷

2018/07/13 Python

python实现翻译word表格小程序

2020/02/27 Python

全球领先的鞋类零售商：The Walking Company

2016/07/21 全球购物

麦德龙官方海外旗舰店：德国麦德龙超市

2017/12/23 全球购物

英国浴室洗脸盆购物网站：Click Basin

2018/06/08 全球购物

Ajax实现页面无刷新留言效果

2021/03/24 Javascript

英文求职信结束语大全

2013/10/26 职场文书

个人实习生的自我评价

2014/02/16 职场文书

周年庆典主持词

2014/04/02 职场文书

活动总结书

2014/05/08 职场文书

党员民主生活会对照检查材料思想汇报

2014/09/28 职场文书

群众路线教育查摆剖析材料

2014/10/10 职场文书

六年级语文下册教学计划

2015/01/22 职场文书

工作能力自我评价2015

2015/03/05 职场文书

2015年端午节国旗下演讲稿

2015/03/19 职场文书

研究生学习计划书应该怎么写？

2019/09/10 职场文书

提取视频中的音频 Python只需要三行代码!

2021/05/10 Python

Nginx安装配置详解

2022/06/25 Servers