Python实现FLV视频拼接功能


Posted in Python onJanuary 21, 2020

文章摘要

本文简单说明了FLV文件的格式,以此为出发点,使用 Python 实现FLV视频的拼接。

一.FLV文件格式

关于FLV文件格式的解析网上有诸多文章,在这里就简单介绍一下需要了解的部分,以便读者更好地明白各段代码的功能。

FLV文件是由文件头(Header)和文件体(Body)按顺序拼接而成。审查FLV内容时,以二进制方式读取内容。

Header:文件头表明了文件的封装格式为FLV,存储对象为音频、视频或两者。
以下为FLV文件的Header,共 9 个字节:

b'FLV\x01\x05\x00\x00\x00\t'
前 3 个字节(FLV)说明这是一个FLV文件
第 4 个字节(\x01)为版本号,固定为 1
第 5 个字节(\x05)表明存储对象,需将其转化成二进制(00000101)查看,左、右边的 1 分别表示文件含有音频和视频
后 4 个字节(\x00\x00\x00\t)表示文件头的长度,其值固定为 9

Body:文件体由若干个 Tag 组成,除了第一个,每个 Tag 是由头部( 11 字节)、主体(不定长)和尾部( 4 字节)组成。第一个 Tag 只有尾部。

Tag 又分为 3 类,脚本(scripts)、音频(audio)和视频(video)。通常第 2 个 Tag 为脚本类型,且只有一个,后续的都是音视频类型。

以下为脚本 Tag 的部分,作为示例介绍一下:

头部:b'\x12\x00\tb\x00\x00\x00\x00\x00\x00\x00'
第 1 个字节(\x12)表示 Tag 类型,脚本类型的对应值为 18 ,音频为 8 ,视频为 9
第 2-4 个字节(\x00\tb)表示 Tag 主体的长度,此处为 2402
第 5-7 个字节(\x00\x00\x00)为时间戳,脚本类型的时间戳通常为 0
第 8 个字节(\x00)是时间戳的扩展,当前 3 个字节不够用时会用这个字节当作大端
后 3 个字节(\x00\x00\x00)是 Stream id,固定为 0

主体:脚本 Tag 的主体包含FLV视频的基本信息,如时长、大小、分辨率等,比较复杂,在此不作介绍

尾部:b'\x00\x00\tm'

固定 4 字节,表示 Tag 头部加主体的长度,即 11 + 2402 = 2413

二.FLV视频拼接

将多个FLV视频合成一个可以正常播放的视频,便足够满足大部分的需求。因此,在接下来的拼接过程中,不会对FLV进行细致入微的调整,达到基本要求即可。

设置阅读器

阅读器可以使我们很方便地读取文件内容。

class Reader():
  def __init__(self, content): # content (bytes):FLV文件的二进制内容
    self.content = content
    self.start = 0
    self.eof = False # 判断是否已读完全部内容
    self.length = len(self.content)
    
  def read(self, n=1):
    # 设置 if 语句防止过度读取内容
    if self.length > (self.start + n):
      out = self.content[self.start:self.start + n]
      self.start += n
    else:
      out = self.content[self.start:]
      self.eof = True
    return out

向新建FLV文件写入 Header 和 Tag

在这里假设要拼接的视频基本信息相似,即都含有音视频,分辨率、码率等相同或相近。

为了生成一个可以正常播放的FLV视频,Header 和 Tag 是必不可少的。我们可以选取第一个FLV的文件头写入新建FLV中,然后依次将修改过时间戳的 Tag 写入其中,便可达到拼接目的。

def add_flv(flv, target, videoTimeStamp, audioTimeStamp): # 修改并添加 Tag 的函数
  with open(flv, 'rb') as f:
    content = f.read()
  reader = Reader(content)
  header = reader.read(13)
  with open(target, 'ab') as f:
    while not reader.eof: # 一直读取直到读完,此时 reader.eof = True
      dataType = reader.read(1)
      dataSize = reader.read(3)
      timeStamp = int.from_bytes(reader.read(3), 'big') # 将 3 字节转换成整数
      headerRemained = reader.read(4)
      if dataType == b'\t': # 视频
        timeStamp += videoTimeStamp
        videoTS = timeStamp
      if dataType == b'\x08': # 音频
        timeStamp += audioTimeStamp
        audioTS = timeStamp
      timeStamp = timeStamp.to_bytes(3, 'big') # 将整数转换成 3 字节
      tagHeader = dataType + dataSize + timeStamp + headerRemained
      tagData_andSize = reader.read(int.from_bytes(dataSize, 'big') + 4)
      f.write(tagHeader)
      f.write(tagData_andSize)
  return videoTS, audioTS
def merge_flv(flvs, target): # 主函数
  videoTS = 0
  audioTS = 0
  for i, flv in enumerate(flvs):
    with open(flv, 'rb') as f:
      content = f.read()
    reader = Reader(content)
    
    header = reader.read(13) # flvHeader + tagSize0
    if i == 0: # 写入第 1 个FLV视频的文件头
      with open(target, 'wb') as f:
        f.write(header)
        
    videoTS, audioTS = add_flv(flv, target, videoTS, audioTS)

拼接

import time
since = time.time()
flvs = ['m1.flv', 'm2.flv', 'm3.flv', 'm4.flv'] # 视频大小:45MB,20MB,59MB,54MB
target = 't.flv'
merge_flv(flvs, target)
end = time.time()
print('Merging flvs takes {:.2f} s'.format(end - since))
# Merging flvs takes 0.88 s

可以看到,拼接 4 个共 178MB视频用时 0.88 秒。

总结

FLV文件格式还是比较简明的,对数据的要求也是比较宽松的,即便没有对 Scripts 里的参数作调整,拼接后的视频依然能够正常播放。

不过,拼接的视频是有不少隐形问题,如到视频末尾可能会出现音画不同步( 0.5 秒左右)的现象,以及不能够方便地分离出完整的视频和音频。

以上所述是小编给大家介绍的Python实现FLV视频拼接功能,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python 字符串中的字符倒转
Sep 06 Python
Python使用getpass库读取密码的示例
Oct 10 Python
Tensorflow中的placeholder和feed_dict的使用
Jul 09 Python
[原创]Python入门教程1. 基本运算【四则运算、变量、math模块等】
Oct 28 Python
python处理两种分隔符的数据集方法
Dec 12 Python
Python函数基础实例详解【函数嵌套,命名空间,函数对象,闭包函数等】
Mar 30 Python
在PYQT5中QscrollArea(滚动条)的使用方法
Jun 14 Python
Python创建或生成列表的操作方法
Jun 19 Python
Numpy对数组的操作:创建、变形(升降维等)、计算、取值、复制、分割、合并
Aug 28 Python
Python内置加密模块用法解析
Nov 25 Python
Python Selenium安装及环境配置的实现
Mar 17 Python
解决Pymongo insert时会自动添加_id的问题
Dec 05 Python
TFRecord格式存储数据与队列读取实例
Jan 21 #Python
TensorFlow dataset.shuffle、batch、repeat的使用详解
Jan 21 #Python
使用 tf.nn.dynamic_rnn 展开时间维度方式
Jan 21 #Python
python爬取本站电子书信息并入库的实现代码
Jan 20 #Python
浅谈Tensorflow 动态双向RNN的输出问题
Jan 20 #Python
关于tf.nn.dynamic_rnn返回值详解
Jan 20 #Python
双向RNN:bidirectional_dynamic_rnn()函数的使用详解
Jan 20 #Python
You might like
生成静态页面的PHP类
2006/07/15 PHP
使用PHP实现二分查找算法代码分享
2011/06/24 PHP
浅析php中抽象类和接口的概念以及区别
2013/06/27 PHP
php根据isbn书号查询amazon网站上的图书信息的示例
2014/02/13 PHP
PHP定时任务延缓执行的实现
2014/10/08 PHP
php实现倒计时效果
2015/12/19 PHP
漂亮的提示信息(带箭头)
2007/03/21 Javascript
javascript 模拟JQuery的Ready方法实现并出现的问题
2009/12/06 Javascript
JavaScript 入门基础知识 想学习js的朋友可以参考下
2009/12/26 Javascript
javascript获取和判断浏览器窗口、屏幕、网页的高度、宽度等
2014/05/08 Javascript
jQuery实现的调整表格行tr上下顺序
2016/01/10 Javascript
基于javascript实现随机颜色变化效果
2016/01/14 Javascript
JavaScript学习小结之被嫌弃的eval函数和with语句实例详解
2016/08/01 Javascript
前端分页功能的实现以及原理(jQuery)
2017/01/22 Javascript
Angular在模板驱动表单中自定义校验器的方法
2017/08/09 Javascript
深入浅析Node环境和浏览器的区别
2018/08/14 Javascript
JavaScript简单实现的仿微博留言功能示例
2019/01/17 Javascript
js+cavans实现图片滑块验证
2020/09/29 Javascript
vue封装自定义指令之动态显示title操作(溢出显示,不溢出不显示)
2020/11/12 Javascript
[50:29]2014 DOTA2华西杯精英邀请赛 5 24 DK VS iG
2014/05/26 DOTA
Python语言技巧之三元运算符使用介绍
2013/03/04 Python
编写简单的Python程序来判断文本的语种
2015/04/07 Python
Python实现12306火车票抢票系统
2019/07/04 Python
在Matplotlib图中插入LaTex公式实例
2020/04/17 Python
Django Form设置文本框为readonly操作
2020/07/03 Python
关于PyCharm安装后修改路径名称使其可重新打开的问题
2020/10/20 Python
Kathmandu澳洲户外商店:新西兰户外运动品牌
2017/11/12 全球购物
意大利奢侈品购物网站:Deliberti
2019/10/08 全球购物
九年级化学教学反思
2014/01/28 职场文书
《掌声》教学反思
2014/02/23 职场文书
主持词开场白
2014/03/17 职场文书
支行行长竞聘演讲稿
2014/05/15 职场文书
群众路线教育实践活动批评与自我批评
2014/09/15 职场文书
个人先进事迹材料范文
2014/12/29 职场文书
宣传委员竞选稿
2015/11/19 职场文书
Promise静态四兄弟实现示例详解
2022/07/07 Javascript