编程 Python

python3.6根据m3u8下载mp4视频

Posted in Python onJune 17, 2019

需要下载某网站的视频，chrome浏览器按F12打开开发者模式，发现视频链接是以"blob:http"开头的链接，打开这个链接后找不到网页，网上查了下，找到了下载方法，在这里做个记录，如果有错误，欢迎指出。

程序在Windows 10下运行，不过Linux应该也没问题。

使用到的有re模块，requests模块和Crypto模块，其中requests模块和Crypto模块如果没安装可以使用pip命令安装。（Crypto模块安装感觉比较坑，我是从anaconda里拷贝了一份）

下面开始正题：

注：以下使用的m3u8文件所在的网站是自己搭建用来测试的，链接可能会失效。

首先在chrome的network里找到一个m3u8文件的请求，可以通过它下载视频。

python3.6根据m3u8下载mp4视频

通过Preview可以看到m3u8文件的内容。

python3.6根据m3u8下载mp4视频

这里m3u8文件比较重要的内容有两个。

一个是URI后面的链接，这个是加密和解密的秘钥，如果m3u8文件里有这个URI，那么这个视频就是经过了加密的，加密的方法可以看URI前面，这里是AES-128加密算法。

另一个是以ts结尾链接，这个是视频片段，如果是没进行加密的，可以直接打开这个链接下载视频片段，下载下来的是后缀为ts的文件，一般可以直接播放，不过时间很短。如果是加密过的，下载后播放会提示视频文件已损坏。

知道这些后，就可以进行下载了，先获取m3u8文件的内容，然后解析出秘钥（key）和ts的链接，然后下载key对每一个ts进行解密，保存到一个mp4文件里。

下载用的是requests模块，解析key和ts的链接是用的re模块，解密用的是Crypto模块。

使用Crypto需要注意三个地方，一个是安装和导入，第二个是Crypto里AES.new的参数，第三个是decrypt方法的参数。下面先看代码。

导入模块：

import re
import requests
from Crypto.Cipher import AES

初始设置：

# 保存的mp4文件名
name = "dream_it_possible.mp4"

# m3u8文件的url
url = "http://www.jiuyi.info/static/video/secret/dream_it_possible.m3u8"


# 请求头，不一定需要，看网站更改
headers = {
 "Referer": "http://www.jiuyi.info/video/dream_it_possible",
 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 "
     "(KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36",
 }

获取m3u8文件内容，并解析出key和ts文件的url。

# 获取m3u8文件内容
r = requests.get(url)

# 通过正值表达式获取key和ts的url
k = re.compile(r"http://.*?\.key") # key的正则匹配
t = re.compile(r"http://.*?\.ts")  # ts的正则匹配
key_url = k.findall(r.text)[0]  # key的url
ts_urls = t.findall(r.text)  # ts的url列表

下载并解密ts文件，保存为mp4文件。

# 下载key
key = requests.get(key_url).content

# 解密并保存ts
for ts_url in ts_urls:

 ts_name = ts_url.split("/")[-1]  # ts文件名

 # 解密，new有三个参数，
 # 第一个是秘钥（key）的二进制数据，
 # 第二个使用下面这个就好
 # 第三个IV在m3u8文件里URI后面会给出，如果没有，可以尝试把秘钥（key）赋值给IV
 sprytor = AES.new(key, AES.MODE_CBC, IV=key)

 # 获取ts文件二进制数据
 ts = requests.get(ts_url).content

 # 密文长度不为16的倍数，则添加二进制"0"直到长度为16的倍数
 while len(ts) % 16 != 0:
 ts += b"0"
 
 # 写入mp4文件
 with open(name, "ab") as file:
  # decrypt方法的参数需要为16的倍数，如果不是，需要在后面补二进制"0"
  file.write(sprytor.decrypt(ts)) 
 print(name, "下载完成")

到这里就下载完成了。

完整代码：

import re
import requests
from Crypto.Cipher import AES


# 保存的mp4文件名
name = "dream_it_possible.mp4"

# m3u8文件的url
url = "http://www.jiuyi.info/static/video/secret/dream_it_possible.m3u8"


# 请求头，不一定需要，看网站更改
headers = {
 "Referer": "http://www.jiuyi.info/video/dream_it_possible",
 "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 "
     "(KHTML, like Gecko) Chrome/71.0.3578.80 Safari/537.36",
 }

print("正在解析：" + url.split("/")[-1])

# 获取m3u8文件内容
r = requests.get(url)

# 通过正值表达式获取key和ts的链接
k = re.compile(r"http://.*?\.key") # key的正则匹配
t = re.compile(r"http://.*?\.ts") # ts的正则匹配
key_url = k.findall(r.text)[0] # key的url
ts_urls = t.findall(r.text) # ts的url列表

# 下载key的二进制数据
print("正在下载key")
key = requests.get(key_url).content

# 解密并保存ts
for ts_url in ts_urls:

 ts_name = ts_url.split("/")[-1]  # ts文件名

 # 解密，new有三个参数，
 # 第一个是秘钥（key）的二进制数据，
 # 第二个使用下面这个就好
 # 第三个IV在m3u8文件里URI后面会给出，如果没有，可以尝试把秘钥（key）赋值给IV
 sprytor = AES.new(key, AES.MODE_CBC, IV=key)

 # 获取ts文件二进制数据
 print("正在下载：" + ts_name)
 ts = requests.get(ts_url).content

 # 密文长度不为16的倍数，则添加b"0"直到长度为16的倍数
 while len(ts) % 16 != 0:
  ts += b"0"

 print("正在解密：" + ts_name)

 # 写入mp4文件
 with open(name, "ab") as file:
  # # decrypt方法的参数需要为16的倍数，如果不是，需要在后面补二进制"0"
  file.write(sprytor.decrypt(ts))
  print("保存成功：" + ts_name)
print(name, "下载完成")

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python3.6根据m3u8下载mp4视频

- Author -

李嘉坤

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

在Lighttpd服务器中运行Django应用的方法

Jul 22 Python

浅谈Python中函数的参数传递

Jun 21 Python

离线安装Pyecharts的步骤以及依赖包流程

Apr 23 Python

Python实现的选择排序算法原理与用法实例分析

Nov 22 Python

Python3调用百度AI识别图片中的文字功能示例【测试可用】

Mar 13 Python

Python搭建代理IP池实现获取IP的方法

Oct 27 Python

python如何使用socketserver模块实现并发聊天

Dec 14 Python

在Python 的线程中运行协程的方法

Feb 24 Python

使用K.function()调试keras操作

Jun 17 Python

python使用bs4爬取boss直聘静态页面

Oct 10 Python

Django 实现jwt认证的示例

Apr 30 Python

python+pytest接口自动化之token关联登录的实现

Apr 06 Python

python如何实现视频转代码视频

Jun 17 #Python

python批量爬取下载抖音视频

Jun 17 #Python

python批量下载抖音视频

Jun 17 #Python

Python基础学习之类与实例基本用法与注意事项详解

Jun 17 #Python

python文本数据处理学习笔记详解

Jun 17 #Python

python3+PyQt5 实现Rich文本的行编辑方法

Jun 17 #Python

Appium+python自动化之连接模拟器并启动淘宝APP（超详解）

Jun 17 #Python

You might like

一个简单的域名注册情况查询程序

2006/10/09 PHP

PHP中isset()和unset()函数的用法小结

2014/03/11 PHP

php获取文件名称和扩展名的方法

2017/02/07 PHP

PHP DB 数据库连接类定义与用法示例

2019/03/11 PHP

laravel框架 api自定义全局异常处理方法

2019/10/11 PHP

jQuery 使用手册(四)

2009/09/23 Javascript

javascript getElementsByClassName实现代码

2010/10/11 Javascript

Javascript中的delete介绍

2012/09/02 Javascript

Extjs grid添加一个图片状态或者按钮的方法

2014/04/03 Javascript

node.js中的path.basename方法使用说明

2014/12/09 Javascript

JavaScript实现下拉列表框数据增加、删除、上下排序的方法

2015/08/11 Javascript

jquery的幻灯片图片切换效果代码分享

2015/09/07 Javascript

jQuery进行组件开发完整实例

2015/12/15 Javascript

多个js毫秒倒计时同时进行效果

2016/01/05 Javascript

jQuery Mobile漏洞会有跨站脚本攻击风险

2017/02/12 Javascript

Angular.js中$resource高大上的数据交互详解

2017/07/30 Javascript

移动设备手势事件库Touch.js使用详解

2017/08/18 Javascript

浅谈高大上的微信小程序中渲染html内容—技术分享

2018/10/25 Javascript

JavaScript单线程和任务队列原理解析

2020/02/04 Javascript

详解Vue中的自定义指令

2020/12/07 Vue.js

python 装饰器功能以及函数参数使用介绍

2012/01/27 Python

解决pyinstaller打包exe文件出现命令窗口一闪而过的问题

2018/10/31 Python

基于python实现名片管理系统

2018/11/30 Python

pytorch实现onehot编码转为普通label标签

2020/01/02 Python

浅谈Tensorflow加载Vgg预训练模型的几个注意事项

2020/05/26 Python

django表单中的按钮获取数据的实例分析

2020/07/31 Python

Python爬虫过程解析之多线程获取小米应用商店数据

2020/11/14 Python

美体小铺加拿大官方网站：The Body Shop加拿大

2016/10/30 全球购物

NEW LOOK官网：英国时装零售巨头之一，快时尚品牌

2017/01/11 全球购物

酒吧总经理岗位职责

2013/12/10 职场文书

班队活动设计方案

2014/01/30 职场文书

新春寄语大全

2014/04/09 职场文书

幼儿教师师德演讲稿

2014/05/06 职场文书

公司试用期员工自我评价

2014/09/17 职场文书

python 实现两个变量值进行交换的n种操作

2021/06/02 Python

Golang入门之计时器

2022/05/04 Golang