Python音频操作工具PyAudio上手教程详解


Posted in Python onJune 26, 2019

Python音频操作工具PyAudio上手教程详解

0.引子

当需要使用Python处理音频数据时,使用python读取与播放声音必不可少,下面介绍一个好用的处理音频PyAudio工具包。

PyAudio是Python开源工具包,由名思义,是提供对语音操作的工具包。提供录音播放处理等功能,可以视作语音领域的OpenCv。

1.简介

PyAudio为跨平台音频I / O库 PortAudio 提供 Python 绑定。使用PyAudio,您可以轻松地使用Python在各种平台上播放和录制音频,例如GNU / Linux,Microsoft Windows和Apple Mac OS X / macOS。

PyAudio的灵感来自:

  • pyPortAudio / fastaudio :PortAudio  v18  API的Python绑定。
  •  tkSnack :Tcl / Tk和Python的跨平台声音工具包。

2.安装

目前的版本是 PyAudio v0.2.11 。在大多数平台上使用pip安装PyAudio。对于v0.2.9之前的版本,PyAudio分发安装二进制文件,这些文件 存档在这里 。

微软Windows

使用 pip 安装:

python -m pip install pyaudio

笔记:

  • 如果pip尚未与您的Python安装捆绑在一起,请 在此处 获取 。
  • pip将获取并安装PyAudio轮(预先打包的二进制文件)。目前,有车轮兼容Python 2.7,3.4,3.5和3.6 的 官方发行版 。对于这些版本,可以使用32位和64位车轮。
  • 这些二进制文件包括使用MinGW构建的PortAudio v19 v190600_20161030。它们仅支持Windows MME API, 包括对DirectX,ASIO等的支持。如果需要支持未包含的API,则需要编译PortAudio和PyAudio。 Apple Mac OS X.

使用 Homebrew 安装必备的portaudio库,然后使用pip安装PyAudio:

brew install portaudio 
pip install pyaudio

笔记:

  • 如果尚未安装,请下载  Homebrew 。
  • pip将下载PyAudio源代码并为您的Python版本构建它。
  • Homebrew和构建PyAudio还需要安装Xcode命令行工具( 更多信息 )。

Debian / Ubuntu

使用包管理器安装PyAudio:

sudo apt-get install python-pyaudio python3-pyaudio

如果没有最新版本的PyAudio,请使用pip安装它:

pip install pyaudio

笔记:

  • pip将下载PyAudio源并为您的系统构建它。请务必事先安装portaudio库开发包( portaudio19-dev )和python开发包( python-all-dev )。
  • 为了更好地隔离系统包,请考虑在virtualenv中 安装PyAudio 。

 PyAudio来源

源代码可从Python Package Index(PyPI)下载: pypi.python.org/pypi/PyAudio 。

或克隆git存储库:

git clone  https://people.csail.mit.edu/hubert/git/pyaudio.git

要从源代码构建PyAudio,您还需要构建 PortAudio v19 。有关为各种平台构建PyAudio的一些说明,请参阅 编译提示 。要使用Microsoft Visual Studio构建PyAudio,请查看Sebastian Audet的 说明 。

3.示例

1).采集音频

下面以一段代码演示如何从计算机麦克风采集一段音频,采集音频时长 4s,保存文件 output.wav

使用了tqdm模块,可以方便显示出来读取过程,如下:

* recording
100%|??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????| 172/172 [00:03<00:00, 43.40it/s] 
* done recording
import pyaudio
import wave
from tqdm import tqdm
def record_audio(wave_out_path,record_second):
  CHUNK = 1024
  FORMAT = pyaudio.paInt16
  CHANNELS = 2
  RATE = 44100
  p = pyaudio.PyAudio()
  stream = p.open(format=FORMAT,
          channels=CHANNELS,
          rate=RATE,
          input=True,
          frames_per_buffer=CHUNK)
  wf = wave.open(wave_out_path, 'wb')
  wf.setnchannels(CHANNELS)
  wf.setsampwidth(p.get_sample_size(FORMAT))
  wf.setframerate(RATE)
  print("* recording")
  for i in tqdm(range(0, int(RATE / CHUNK * record_second))):
    data = stream.read(CHUNK)
    wf.writeframes(data)
  print("* done recording")
  stream.stop_stream()
  stream.close()
  p.terminate()
  wf.close()
record_audio("output.wav",record_second=4)

要使用PyAudio,首先使用 pyaudio.PyAudio()

(1)实例化PyAudio ,它设置portaudio系统。

要录制或播放音频,请使用 pyaudio.PyAudio.open()

(2)在所需设备上打开所需音频参数的流。这设置了 pyaudio.Stream 播放或录制音频。

通过使用流式传输 pyaudio.Stream.write() 音频数据或使用流式传输音频数据来播放音频  pyaudio.Stream.read()

(3)请注意,在“阻止模式”中,每个 pyaudio.Stream.write() 或  pyaudio.Stream.read() 阻止直到所有给定/请求的帧都被播放/记录。或者,要动态生成音频数据或立即处理录制的音频数据,请使用下面概述的“回调模式”。

使用 pyaudio.Stream.stop_stream() 暂停播放/录制,并 pyaudio.Stream.close() 终止流。(4)

最后,使用 pyaudio.PyAudio.terminate() (5)终止portaudio会话

2).播放音频

下面使用播放的功能来播放1)中保存的音频 output.wav

通过tqdm,显示播放进度条,如下:

100%|??????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????| 172/172 [00:03<00:00, 43.40it/s]
"""PyAudio Example: Play a WAVE file."""
import pyaudio
import wave
from tqdm import tqdm
def play_audio(wave_path):
  CHUNK = 1024
  wf = wave.open(wave_path, 'rb')
  # instantiate PyAudio (1)
  p = pyaudio.PyAudio()
  # open stream (2)
  stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
          channels=wf.getnchannels(),
          rate=wf.getframerate(),
          output=True)
  # read data
  data = wf.readframes(CHUNK)
  # play stream (3)
  datas = []
  while len(data) > 0:
    data = wf.readframes(CHUNK)
    datas.append(data)
  for d in tqdm(datas):
    stream.write(d)
  # stop stream (4)
  stream.stop_stream()
  stream.close()
  # close PyAudio (5)
  p.terminate()
play_audio("output.wav")

2).以回调方式播放音频

当需要在执行其他程序时同时播放音频,可以使用回调的方式播放,示例代码如下:

"""PyAudio Example: Play a WAVE file."""
import pyaudio
import wave
from tqdm import tqdm
import time
def play_audio_callback(wave_path):
  CHUNK = 1024
  wf = wave.open(wave_path, 'rb')
  # instantiate PyAudio (1)
  p = pyaudio.PyAudio()
  def callback(in_data, frame_count, time_info, status):
    data = wf.readframes(frame_count)
    return (data, pyaudio.paContinue)
  # open stream (2)
  stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
          channels=wf.getnchannels(),
          rate=wf.getframerate(),
          output=True,
          stream_callback=callback)
  # read data
  stream.start_stream()
  while stream.is_active():
    time.sleep(0.1)
  # stop stream (4)
  stream.stop_stream()
  stream.close()
  # close PyAudio (5)
  p.terminate()
play_audio_callback("output.wav")

Reference:

1. http://people.csail.mit.edu/hubert/pyaudio/

总结

以上所述是小编给大家介绍的Python音频操作工具PyAudio上手教程详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
跟老齐学Python之有容乃大的list(4)
Sep 28 Python
如何解决django配置settings时遇到Could not import settings 'conf.local'
Nov 18 Python
详解Python3操作Mongodb简明易懂教程
May 25 Python
python中的set实现不重复的排序原理
Jan 24 Python
python 输出上个月的月末日期实例
Apr 11 Python
Flask实现跨域请求的处理方法
Sep 27 Python
Python使用dict.fromkeys()快速生成一个字典示例
Apr 24 Python
django实现用户注册实例讲解
Oct 30 Python
django使用channels实现通信的示例
Oct 19 Python
基于python实现监听Rabbitmq系统日志代码示例
Nov 28 Python
python爬取股票最新数据并用excel绘制树状图的示例
Mar 01 Python
深度学习详解之初试机器学习
Apr 14 Python
python3中类的继承以及self和super的区别详解
Jun 26 #Python
对Python中class和instance以及self的用法详解
Jun 26 #Python
Python中的支持向量机SVM的使用(附实例代码)
Jun 26 #Python
对python 中class与变量的使用方法详解
Jun 26 #Python
python 机器学习之支持向量机非线性回归SVR模型
Jun 26 #Python
python机器学习库scikit-learn:SVR的基本应用
Jun 26 #Python
Python Numpy 实现交换两行和两列的方法
Jun 26 #Python
You might like
PHP中对缓冲区的控制实现代码
2013/09/29 PHP
神奇的7个jQuery 3D插件整理
2011/01/06 Javascript
ExtJs中gridpanel分组后组名排序实例代码
2013/12/02 Javascript
javascript正则匹配汉字、数字、字母、下划线
2014/04/10 Javascript
Nodejs进程管理模块forever详解
2014/06/01 NodeJs
使用jquery修改表单的提交地址基本思路
2014/06/04 Javascript
js查找节点的方法小结
2015/01/13 Javascript
基于jquery编写的放大镜插件
2016/03/23 Javascript
JavaScript字符串对象
2017/01/14 Javascript
Javascript DOM事件操作小结(监听鼠标点击、释放,悬停、离开等)
2017/01/20 Javascript
js oncontextmenu事件使用详解
2017/03/25 Javascript
深入浅出webpack教程系列_安装与基本打包用法和命令参数详解
2017/09/10 Javascript
Bootstrap modal只加载一次数据的解决办法(推荐)
2017/11/24 Javascript
vue项目常用组件和框架结构介绍
2017/12/24 Javascript
JavaScript Math对象和调试程序的方法分析
2019/05/13 Javascript
通过js给网页加上水印背景实例
2019/06/17 Javascript
对Pandas MultiIndex(多重索引)详解
2018/11/16 Python
Python判断有效的数独算法示例
2019/02/23 Python
Pyqt5 实现跳转界面并关闭当前界面的方法
2019/06/19 Python
使用python爬取抖音视频列表信息
2019/07/15 Python
python__name__原理及用法详解
2019/11/02 Python
python selenium循环登陆网站的实现
2019/11/04 Python
浅析python 字典嵌套
2020/09/29 Python
Python+OpenCV图像处理——实现直线检测
2020/10/23 Python
毕业自我鉴定书
2014/03/24 职场文书
提拔干部考察材料
2014/05/26 职场文书
2014年设计师工作总结
2014/11/25 职场文书
生日答谢词
2015/01/05 职场文书
2015年工程师工作总结
2015/04/30 职场文书
辩护词格式
2015/05/22 职场文书
某某店铺的开业庆典主持词范本
2019/11/25 职场文书
JavaScript 实现页面滚动动画
2021/04/24 Javascript
Mysql中存储引擎的区别及比较
2021/06/04 MySQL
Java Kafka 消费积压监控的示例代码
2021/07/01 Java/Android
JS实现数组去重的11种方法总结
2022/04/04 Javascript
go goth封装第三方认证库示例详解
2022/08/14 Golang