编程 Python

python录音并调用百度语音识别接口的示例

Posted in Python onDecember 01, 2020

#！/usr/bin/env python
import requests
import json
import base64
import pyaudio
import wave
import os
import psutil


#首先配置必要的信息
def bat(voice_path):
  baidu_server = 'https://aip.baidubce.com/oauth/2.0/token?'
  grant_type = 'client_credentials'
  client_id = 'uj70rS1LiwZ9sQDvMSUqKsie' #API KEY
  client_secret = 'Q88eav41PzeNLczZ3hlRjhR8e4WShXwD' #Secret KEY  这里可以自己去百度注册，这里是我的API KEY 和 Secret KEY

  #合成请求token的url
  url = baidu_server+'grant_type='+grant_type+'&client_id='+client_id+'&client_secret='+client_secret

  #获取token
  res = requests.get(url).text
  data = json.loads(res)
  token = data['access_token']

  #设置音频的属性，采样率，格式等
  VOICE_RATE = 8000
  FILE_NAME = voice_path
  # USER_ID = '16241950' #这里的id随便填填就好啦，我填的自己昵称
  FILE_TYPE = 'wav'
  CUID="wate_play"
  #读取文件二进制内容
  f_obj = open(FILE_NAME, 'rb')
  content = base64.b64encode(f_obj.read())  # 百度语音识别需要base64编码格式
  speech = content.decode("utf-8")
  size = os.path.getsize(FILE_NAME)

  #json封装
  datas = json.dumps({
    'format': FILE_TYPE,
    'rate': VOICE_RATE,
    'channel': 1,
    'cuid': CUID,
    'token': token,
    'speech': speech,
    'len': size,
    "dev_pid":"1536"
  })
  return datas

#设置headers和请求地址url
def post(datas):
  headers = {'Content-Type':'application/json'}
  url = 'https://vop.baidu.com/server_api'
  # url = "http://vop.baidu.com/server_api"

  #用post方法传数据
  request = requests.post(url, datas, headers)
  result = json.loads(request.text)
  text = result.get("result")
  if result['err_no'] == 0:
    return text
  else:
    return "Error"


def get_audio(filepath):
  input("回车开始录音 >>>")   #输出提示文本，input接收一个值,转为str，赋值给aa
  CHUNK = 256         #定义数据流块
  FORMAT = pyaudio.paInt16  #量化位数（音量级划分）
  CHANNELS = 1        # 声道数;声道数：可以是单声道或者是双声道
  RATE = 8000        # 采样率;采样率：一秒内对声音信号的采集次数，常用的有8kHz, 16kHz, 32kHz, 48kHz, 11.025kHz, 22.05kHz, 44.1kHz
  RECORD_SECONDS = 5     #录音秒数
  WAVE_OUTPUT_FILENAME = filepath   #wav文件路径
  p = pyaudio.PyAudio()        #实例化

  stream = p.open(format=FORMAT,
          channels=CHANNELS,
          rate=RATE,
          input=True,
          frames_per_buffer=CHUNK)
  print("*"*10, "开始录音：请在5秒内输入语音")
  frames = []                         #定义一个列表
  for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):   #循环，采样率11025 / 256 * 5
    data = stream.read(CHUNK)                #读取chunk个字节 保存到data中
    frames.append(data)                   #向列表frames中添加数据data
  # print(frames)
  print("*" * 10, "录音结束\n")

  stream.stop_stream()
  stream.close()     #关闭
  p.terminate()      #终结

  wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')         #打开wav文件创建一个音频对象wf，开始写WAV文件
  wf.setnchannels(CHANNELS)                  #配置声道数
  wf.setsampwidth(p.get_sample_size(FORMAT))         #配置量化位数
  wf.setframerate(RATE)                    #配置采样率
  wf.writeframes(b''.join(frames))              #转换为二进制数据写入文件
  wf.close()       #关闭
  return


def check_disk():
  list_drive = psutil.disk_partitions() # 找出本地磁盘列表，保存的是结构体对象
  list_disk = []
  for drive in list_drive:
    list_disk.append(drive.device)
  return list_disk


if __name__ == '__main__':
  list_disk = check_disk() # 检索本地磁盘
  dirname_path = os.path.join(list_disk[0], "voice") # 设置语音文件存放路径， 
                                  （mac os下需要自己定存储路径）
  if not os.path.exists(dirname_path):
    os.makedirs(dirname_path)

  filename = "voice.wav" # 定义语音文件名
  in_path = os.path.join(dirname_path, filename)

  get_audio(in_path) # 录音

  datas = bat(in_path) # 封装百度语音识别需要的配置信息，返回请求头
  res = post(datas) # 连接百度语音识别接口，得到识别结果
  print("识别结果：",res[0])

实现效果：

在上述代码中，需要装到requests、psutil、pyaudio等库，其中pyaudio这个库在python3环境下装比较特殊，

windows环境下具体步骤如下：

第一步：下载whl文件支持

url：https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio

python录音并调用百度语音识别接口的示例

注意：

下载自己python解释器对应版本的

不要下载错了，资源很多

第二步：打开cmd，cd 进入下载的whl所在目录

执行命令：pip install Twisted-18.7.0-cp36-cp36m-win_amd64.whl # 下载的什么版本，后面就跟什么版本

第三步：执行命令：pip install pyaudio 安装

如果本地同时装有python2和python3，想装到python3里可以在cmd命令里把 pip 改成 pip3 即可

mac os 下安装pyaudio步骤如下：

python录音并调用百度语音识别接口的示例

到这里就结束啦！

以上就是python录音并调用百度语音识别接口的示例的详细内容，更多关于python 录音并调用语音识别接口的资料请关注三水点靠木其它相关文章！

python录音并调用百度语音识别接口的示例

- Author -

希希大队长

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python实现Tab自动补全和历史命令管理的方法

Mar 12 Python

详解Django中的过滤器

Jul 16 Python

python八大排序算法速度实例对比

Dec 06 Python

使用Python创建简单的HTTP服务器的方法步骤

Apr 26 Python

python+selenium实现自动化百度搜索关键词

Jun 03 Python

python替换字符串中的子串图文步骤

Jun 19 Python

Python列表list常用内建函数实例小结

Oct 22 Python

django 框架实现的用户注册、登录、退出功能示例

Nov 28 Python

python opencv根据颜色进行目标检测的方法示例

Jan 15 Python

基于OpenCV的网络实时视频流传输的实现

Nov 15 Python

python压包的概念及实例详解

Feb 17 Python

如何使用python包中的sched事件调度器

Apr 30 Python

用python爬虫批量下载pdf的实现

Dec 01 #Python

python3字符串输出常见面试题总结

Dec 01 #Python

python3中数组逆序输出方法

Dec 01 #Python

Python爬虫简单运用爬取代理IP的实现

Dec 01 #Python

python爬虫请求头的使用

Dec 01 #Python

在pycharm创建scrapy项目的实现步骤

Dec 01 #Python

Python实现迪杰斯特拉算法并生成最短路径的示例代码

Dec 01 #Python

You might like

php递归列出所有文件和目录的代码

2008/09/10 PHP

php获取网页中图片、DIV内容的简单方法

2014/06/19 PHP

PHP实现UTF-8文件BOM自动检测与移除实例

2014/11/05 PHP

php常用的工具开发整理

2019/09/26 PHP

做网页的一些技巧

2007/02/01 Javascript

javascript 处理事件绑定的一些兼容写法

2009/12/24 Javascript

jquery下为Event handler传递动态参数的代码

2011/01/06 Javascript

Javascript 修改String 对象增加去除空格功能(示例代码)

2013/11/30 Javascript

JavaScript数组常用操作技巧汇总

2014/11/17 Javascript

JavaScript中数组成员的添加、删除介绍

2014/12/30 Javascript

jquery小火箭返回顶部代码分享

2015/08/19 Javascript

百度坐标（BD09）、国测局坐标（火星坐标，GCJ02）、和WGS84坐标系之间的转换

2016/02/19 Javascript

js本地图片预览实现代码

2016/10/09 Javascript

微信小程序中做用户登录与登录态维护的实现详解

2017/05/17 Javascript

JS之if语句对接事件动作逻辑(详解)

2017/06/28 Javascript

es6学习之解构时应该注意的点

2017/08/29 Javascript

vue.js $refs和$emit 父子组件交互的方法

2017/12/20 Javascript

你点的 ES6一些小技巧,请查收

2018/04/25 Javascript

angular 数据绑定之[]和{{}}的区别

2018/09/25 Javascript

Vue-cli3简单使用(图文步骤)

2019/04/30 Javascript

Vue.js递归组件实现组织架构树和选人功能

2019/07/04 Javascript

vuex state中的数组变化监听实例

2019/11/06 Javascript

Python 爬虫学习笔记之多线程爬虫

2016/09/21 Python

详解python脚本自动生成需要文件实例代码

2017/02/04 Python

Python面向对象基础入门之设置对象属性

2018/12/11 Python

Python3常见函数range()用法详解

2019/12/30 Python

jupyter notebook 实现matplotlib图动态刷新

2020/04/22 Python

浅谈keras中自定义二分类任务评价指标metrics的方法以及代码

2020/06/11 Python

如何解决cmd运行python提示不是内部命令

2020/07/01 Python

日本PLST在线商店：日本时尚杂志刊载的人气服装

2016/12/10 全球购物

美国在线奢侈品寄售商店：Luxury Garage Sale

2018/08/19 全球购物

求职信的七个关键技巧

2014/02/05 职场文书

党政领导班子四风问题对照检查材料思想汇报

2014/10/02 职场文书

大学辅导员述职报告

2015/01/10 职场文书

公积金具结保证书

2015/05/11 职场文书

2019最新劳动仲裁申请书！

2019/07/08 职场文书