Python中操作各种多媒体,视频、音频到图片的代码详解


Posted in Python onJune 04, 2020

Python中操作各种多媒体,视频、音频到图片的代码详解

我们经常会遇到一些对于多媒体文件修改的操作,像是对视频文件的操作:视频剪辑、字幕编辑、分离音频、视频音频混流等。又比如对音频文件的操作:音频剪辑,音频格式转换。再比如我们最常用的图片文件,格式转换、各个属性的编辑等。因为多媒体文件的操作众多,本文选取一些极具代表性的操作,以代码的形式实现各个操作。

一、图片操作

操作图片的模块有许多,其中比较常用的两个就是 Pillowopencv ,两个模块各有优势。其中 opencv 是计算机视觉处理的开源模块,应用的范围更加广泛,从图像处理到视频处理,再到物体检测等。而 pillow 相比直线就单纯的多,其大多数操作都是围绕图像而展开的。

1.1、格式转换

图片格式有多种多样,最直观的感受就是图片后缀。而格式之间的差异不仅仅是后缀的差异,最为明显的就是 png 格式图片,同其它图片有着最为直观的区别。下面我们就看看在Python中如何转换格式,我们先安装 pillow 模块:

pip install pillow

然后看看如何导入模块以及如何读取图像:

from PIL import Image
# 读取图像
img = Image.open('ycjc.jpg')
# 显示图像
img.show()

我们有了上面的基础操作之后,就可以开始进行格式转换了,我们用有村大妹子的图片作为素材:

Python中操作各种多媒体,视频、音频到图片的代码详解

我们可以看到这是一张白色背景的图片,我们将它转成 png 看看效果:

from PIL import Image
# 读取图像
img = Image.open('ycjc.jpg')
# 格式转换,其中A为透明度
png = img.convert('RGBA')
# 保存图像,因为是RGBA格式,所以后缀应该为png
png.save('ycjc.png')

输出的图片我就不放了,我们观察输出图片会发现,白色背景好像变透明了。不要怀疑,这只是心理作用,其实图片看上去是不会有任何变化的。但是实际上图片从原来的 RGB 三个色道变成了 RGBA 四个色道,我们会发现,图片变大了:

Python中操作各种多媒体,视频、音频到图片的代码详解

虽然 A 色道的透明度全部都是0,但是实际上还是存在这个色道,所以大小方面有了明显的增加。更多转换模式可以参考超全Python图像处理讲解(多图预警)。

1.2、图片裁剪

图片裁剪的操作也非常常用,我们来看看 pillow 如何裁剪图片:

from PIL import Image
# 读取图像
img = Image.open('ycjc.jpg')
# 裁剪图像,调用crop方法,传入裁剪区域的元组
img_crop = img.crop((100, 100, 400, 400))
# 保存裁剪后的图像
img_crop.save('ycjc_crop.jpg')

我们调用 crop 方法,传入裁剪区域的元组进行裁剪,元组的内容为左上角的坐标(前两个参数)即右下角的坐标(后两个参数)。效果图如下:

Python中操作各种多媒体,视频、音频到图片的代码详解 

1.3、截屏

虽然算不上是图像操作,但是还是个非常实用的操作。我们实现截屏是通过ImageGrap类实现的:

from PIL import ImageGrab
# 截取全屏
im = ImageGrab.grab()
# 保存图像
im.save('win.png')

除了截取全屏我们也可以区域截屏:

im =ImageGrab.grab((300, 100, 1400, 600))

参数元组含义与 crop 方法一致。

除了上述操作,还有更多像是添加滤镜、对比度调节、亮度调节、色彩调节等,由于内容众多,所以不在本文详细讨论。

二、音频操作

音频的操作也比较繁多,我们最常用到的就是音频剪辑和音量调节了。我们这里使用 pydub 模块来进行音频文件的操作。

2.1、pydub的安装以及读取音频

安装我们还是使用pip:

pip install pydub

然后我们来读取一个 wav 文件:

from pydub import AudioSegment
# 读取wav格式的音频文件
music = AudioSegment.from_wav('百年孤独.wav')

这样我们就完成了音频文件的读取, wav 文件是一种未经压缩的文件,我们可以通过 pydub 直接读取。读取其它类型的文件 pydub 同样提供了相应的方法:

music = AudioSegment.from_mp3('music.mp3')
music = AudioSegment.from_ogg("music.ogg")
music = AudioSegment.from_flv("music.flv")

因为在实际操作过程中遇到了一个未找明缘由的错误,所以本文的音频操作只针对 wav 格式。

2.2、音频剪切

音频剪辑的实现我们是通过类似ndarray的中括号操作的:

# 截取前20秒
clip = music[:20*1000]
# 截取后20秒
clip = music[-20000:]
# 从第20秒截取到第40秒
clip = music[20*1000:40*1000]

剪切好的片段我们可以另外存一个文件:

# 保存文件为clip.mp3,格式为mp3
clip.export('clip.mp3', format='mp3')

3.3、增加/减少音量

音量的控制我们只需要用音频对象加一个常数即可:

# 音量减5
music -= 5
# 音量加5
music += 5

3.4、音频拼接

我们先看看重复拼接:

# 在音频文件末尾重复拼接该音频
music = music*2

拼接后的音频的效果就是原音频循环两次。接下来我们看看拼接不同的音频:

# 裁剪前20秒音频
clip1 = music[:20*1000]
# 裁剪后20秒音频
clip2 = music[-20*1000:]
# 拼接音频
clip = clip1 + clip2

3.5、 交叉渐入渐出

交叉渐入渐出是一种比较柔和的音频转场方式,在两个音频切换的间歇会有一个重合,用代码实现如下:

# 截取前20秒
begin = music[20*1000:40*1000]
# 截取后20秒
end = music[-20*1000:]
# 添加交叉渐入渐出 效果
clip = begin.append(end, crossfade=1500)

我们可以看到我们一共裁剪了40秒,在生成的文件我们可以看到只有38秒,因为转场的时候有个重合的效果。当然还有更多的操作,大家可以自己去了解。

三、视频操作

视频的操作可以通过 moviepyopencv 进行,我们先分别安装两个模块:

pip install opencv-python
pip install moviepy

3.1、视频剪辑

相比之下 moviepy 操作视频要更便利,我们看看使用 moviepy 如何剪辑视频:

from moviepy.editor import *
# 剪切视屏bws.mp4中第50秒到第60秒
clip = VideoFileClip('bws.mp4').subclip(50, 60)
# 将剪切的片段保存
clip.write_videofile("clip.mp4")

3.2、提取音频文件

VideoFileClip 类中,音频文件作为其中的一个参数,我们可以直接获取:

from moviepy.editor import *
# 读取视频文件
video = VideoFileClip('bws.mp4')
# 获取其中音频
audio = video.audio
# 保存音频文件
audio.write_audiofile('audio.mp3')

3.3、混流

我们还可以将音频同视频混流,在moviepy中,提供了一个读取音频文件的类,我们设置视频的音频需要创建这个类的对象:

from moviepy.editor import *
# 读取视频
video = VideoFileClip('bws.mp4')
# 读取音频
audio = AudioFileClip('百年孤独.mp3')
# 设置视频的音频
video = video.set_audio(audio)
# 保存新的视频文件
video.write_videofile('bws_audio.mp4')

3.4、逐帧提取画面

我们都知道,视频是由一帧一帧的图片组成的,我们也可以将画面一帧一帧提取出来:

import cv2
# 读取视频
video = cv2.VideoCapture('bws.mp4')
# 逐帧读取,当还有画面时ret为True,frame为当前帧的ndarray对象
ret, frame = video.read()
i = 0
# 循环读取
while ret:
 i += 1
 cv2.imwrite('v'+str(i) + '.jpg', frame)
 ret, frame = video.read()

上述代码就能将视屏的每一帧以图片的形式保存下来。

3.5、截取gif

截取gif和截取视频没有什么区别,不过为了减少gif的大小,我们通常会对视频进行尺寸缩放:

from moviepy.editor import *
# 读取视频
video = VideoFileClip('bws.mp4')
# 裁剪视频,并缩小一半
video = video.subclip(20, 30).resize((0.5))
# 保存gif图片
video.write_gif('bws.gif')

在上面subclip方法中,我们可以传入元组,例如:

video.subclip((1, 20), (2, 30))

其含义为从1分20秒截取到2分30秒。

总结

到此这篇关于Python中操作各种多媒体,视频、音频到图片的代码详解的文章就介绍到这了,更多相关python多媒体视频音频图片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
qpython3 读取安卓lastpass Cookies
Jun 19 Python
vscode 远程调试python的方法
Dec 01 Python
Python使用matplotlib绘制正弦和余弦曲线的方法示例
Jan 06 Python
python3调用百度翻译API实现实时翻译
Aug 16 Python
python创建文件备份的脚本
Sep 11 Python
Python正则表达式指南 推荐
Oct 09 Python
python 分离文件名和路径以及分离文件名和后缀的方法
Oct 21 Python
在python中pandas的series合并方法
Nov 12 Python
django框架用户权限中的session缓存到redis中的方法
Aug 06 Python
Pytorch保存模型用于测试和用于继续训练的区别详解
Jan 10 Python
python如何安装下载后的模块
Jul 03 Python
Python 字符串池化的前提
Jul 03 Python
Python简单实现词云图代码及步骤解析
Jun 04 #Python
Python坐标轴操作及设置代码实例
Jun 04 #Python
Python flask框架实现查询数据库并显示数据
Jun 04 #Python
使用opencv中匹配点对的坐标提取方式
Jun 04 #Python
Python实现计算图像RGB均值方式
Jun 04 #Python
用python按照图像灰度值统计并筛选图片的操作(PIL,shutil,os)
Jun 04 #Python
Python flask框架实现浏览器点击自定义跳转页面
Jun 04 #Python
You might like
DSP接收机前端设想
2021/03/02 无线电
再次研究下cache_lite
2007/02/14 PHP
完美解决dedecms中的[html][/html]和[code][/code]问题
2007/03/20 PHP
php 文本文件的读取效率
2012/02/10 PHP
使用淘宝IP库获取用户ip地理位置
2013/10/27 PHP
php处理带有中文URL的方法
2016/07/11 PHP
eval与window.eval的差别分析
2011/03/17 Javascript
深入理解JavaScript系列(6):S.O.L.I.D五大原则之单一职责SRP
2012/01/15 Javascript
javascript重复绑定事件造成的后果说明
2013/03/02 Javascript
jQuery插件实现屏蔽单个元素使用户无法点击
2013/04/12 Javascript
Javascript的闭包详解
2014/12/26 Javascript
Javascript实现的Map集合工具类完整实例
2015/07/31 Javascript
JQuery用户名校验的具体实现
2016/03/18 Javascript
使用jQuery制作浮动工具栏的实例分享
2016/05/13 Javascript
详解angularJs中关于ng-class的三种使用方式说明
2017/06/02 Javascript
详解vue-cli中配置sass
2017/06/21 Javascript
Array数组对象中的forEach、map、filter及reduce详析
2018/08/02 Javascript
vue中,在本地缓存中读写数据的方法
2018/09/21 Javascript
vue 中 elment-ui table合并上下两行相同数据单元格
2019/12/26 Javascript
antd vue table跨行合并单元格,并且自定义内容实例
2020/10/28 Javascript
[02:26]DOTA2英雄米拉娜基础教程
2013/11/25 DOTA
[01:36:57]【09DOTA2第一视角】小骷髅
2014/04/16 DOTA
[01:06:18]DOTA2-DPC中国联赛 正赛 Phoenix vs Dynasty BO3 第二场 1月26日
2021/03/11 DOTA
[22:07]DOTA2-DPC中国联赛 正赛 iG vs Magma 选手采访
2021/03/11 DOTA
学习python (1)
2006/10/31 Python
运用PyTorch动手搭建一个共享单车预测器
2019/08/06 Python
Python学习笔记之列表推导式实例分析
2019/08/13 Python
详解Python 循环嵌套
2020/07/09 Python
Python使用正则表达式实现爬虫数据抽取
2020/08/17 Python
Python join()函数原理及使用方法
2020/11/14 Python
详解html5 postMessage解决跨域通信的问题
2018/08/17 HTML / CSS
init进程的作用
2012/04/12 面试题
大学信息公开实施方案
2014/03/09 职场文书
2015年度环卫处工作总结
2015/07/24 职场文书
安全伴我行主题班会
2015/08/13 职场文书
使用pycharm运行flask应用程序的详细教程
2021/06/07 Python