编程 Python

python调用百度语音REST API

Posted in Python onAugust 30, 2018

本文实例为大家分享了python调用百度语音REST API的具体代码，供大家参考，具体内容如下

（百度的rest接口的部分网址发生了一定的变化，相关代码已更新）

百度通过 REST API 的方式给开发者提供一个通用的 HTTP 接口，基于该接口，开发者可以轻松的获得语音合成与语音识别能力。SDK中只提供了PHP、C和JAVA的相关样例，使用python也可以灵活的对端口进行调用，本文描述了简单使用Python调用百度语音识别服务 REST API 的简单样例。

1、语音识别与语音合成的调用

注册开发者帐号和创建应用的过程就不再赘述，百度的REST API在调用过程基本分为三步：

获取token
向Rest接口提交数据
处理返回数据

具体代码如下所示：

#!/usr/bin/python3

import urllib.request
import urllib
import json
import base64
class BaiduRest:
  def __init__(self, cu_id, api_key, api_secert):
    # token认证的url
    self.token_url = "https://openapi.baidu.com/oauth/2.0/token?grant_type=client_credentials&client_id=%s&client_secret=%s"
    # 语音合成的resturl
    self.getvoice_url = "http://tsn.baidu.com/text2audio?tex=%s&lan=zh&cuid=%s&ctp=1&tok=%s"
    # 语音识别的resturl
    self.upvoice_url = 'http://vop.baidu.com/server_api'

    self.cu_id = cu_id
    self.getToken(api_key, api_secert)
    return

  def getToken(self, api_key, api_secert):
    # 1.获取token
    token_url = self.token_url % (api_key,api_secert)

    r_str = urllib.request.urlopen(token_url).read()
    token_data = json.loads(r_str)
    self.token_str = token_data['access_token']
    pass

  def getVoice(self, text, filename):
    # 2. 向Rest接口提交数据
    get_url = self.getvoice_url % (urllib.parse.quote(text), self.cu_id, self.token_str)

    voice_data = urllib.request.urlopen(get_url).read()
    # 3.处理返回数据
    voice_fp = open(filename,'wb+')
    voice_fp.write(voice_data)
    voice_fp.close()
    pass

  def getText(self, filename):
    # 2. 向Rest接口提交数据
    data = {}
    # 语音的一些参数
    data['format'] = 'wav'
    data['rate'] = 8000
    data['channel'] = 1
    data['cuid'] = self.cu_id
    data['token'] = self.token_str
    wav_fp = open(filename,'rb')
    voice_data = wav_fp.read()
    data['len'] = len(voice_data)
    data['speech'] = base64.b64encode(voice_data).decode('utf-8')
    post_data = json.dumps(data)
    r_data = urllib.request.urlopen(self.upvoice_url,data=bytes(post_data,encoding="utf-8")).read()
    # 3.处理返回数据
    return json.loads(r_data)['result']

if __name__ == "__main__":
  # 我的api_key,供大家测试用，在实际工程中请换成自己申请的应用的key和secert
  api_key = "SrhYKqzl3SE1URnAEuZ0FKdT" 
  api_secert = "hGqeCkaMPb0ELMqtRGc2VjWdmjo7T89d"
  # 初始化
  bdr = BaiduRest("test_python", api_key, api_secert)
  # 将字符串语音合成并保存为out.mp3
  bdr.getVoice("你好北京邮电大学!", "out.mp3")
  # 识别test.wav语音内容并显示
  print(bdr.getText("out.wav"))

2、调用pyaudio使用麦克风录制声音

python中的pyaudio库可以直接通过麦克风录制声音，可使用pip进行安装。我们可以通过调用该库，获取到wav测试语音。
具体代码如下所示：

#!/usr/bin/python3
# -*- coding: utf-8 -*-

from pyaudio import PyAudio, paInt16 
import numpy as np 
from datetime import datetime 
import wave

class recoder:
  NUM_SAMPLES = 2000   #pyaudio内置缓冲大小
  SAMPLING_RATE = 8000  #取样频率
  LEVEL = 500     #声音保存的阈值
  COUNT_NUM = 20   #NUM_SAMPLES个取样之内出现COUNT_NUM个大于LEVEL的取样则记录声音
  SAVE_LENGTH = 8     #声音记录的最小长度：SAVE_LENGTH * NUM_SAMPLES 个取样
  TIME_COUNT = 60   #录音时间，单位s

  Voice_String = []

  def savewav(self,filename):
    wf = wave.open(filename, 'wb') 
    wf.setnchannels(1) 
    wf.setsampwidth(2) 
    wf.setframerate(self.SAMPLING_RATE) 
    wf.writeframes(np.array(self.Voice_String).tostring()) 
    # wf.writeframes(self.Voice_String.decode())
    wf.close() 

  def recoder(self):
    pa = PyAudio() 
    stream = pa.open(format=paInt16, channels=1, rate=self.SAMPLING_RATE, input=True, 
      frames_per_buffer=self.NUM_SAMPLES) 
    save_count = 0 
    save_buffer = [] 
    time_count = self.TIME_COUNT

    while True:
      time_count -= 1
      # print time_count
      # 读入NUM_SAMPLES个取样
      string_audio_data = stream.read(self.NUM_SAMPLES) 
      # 将读入的数据转换为数组
      audio_data = np.fromstring(string_audio_data, dtype=np.short)
      # 计算大于LEVEL的取样的个数
      large_sample_count = np.sum( audio_data > self.LEVEL )
      print(np.max(audio_data))
      # 如果个数大于COUNT_NUM，则至少保存SAVE_LENGTH个块
      if large_sample_count > self.COUNT_NUM:
        save_count = self.SAVE_LENGTH 
      else: 
        save_count -= 1

      if save_count < 0:
        save_count = 0 

      if save_count > 0 : 
      # 将要保存的数据存放到save_buffer中
        #print save_count > 0 and time_count >0
        save_buffer.append( string_audio_data ) 
      else: 
      #print save_buffer
      # 将save_buffer中的数据写入WAV文件，WAV文件的文件名是保存的时刻
        #print "debug"
        if len(save_buffer) > 0 : 
          self.Voice_String = save_buffer
          save_buffer = [] 
          print("Recode a piece of voice successfully!")
          return True
      if time_count==0: 
        if len(save_buffer)>0:
          self.Voice_String = save_buffer
          save_buffer = [] 
          print("Recode a piece of voice successfully!")
          return True
        else:
          return False

if __name__ == "__main__":
  r = recoder()
  r.recoder()
  r.savewav("test.wav")

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python调用百度语音REST API

- Author -

狼血wolfblood

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Pyhthon中使用compileall模块编译源文件为pyc文件

Apr 28 Python

python函数形参用法实例分析

Aug 04 Python

python3 对list中每个元素进行处理的方法

Jun 29 Python

安装Pycharm2019以及配置anconda教程的方法步骤

Nov 11 Python

Python Selenium安装及环境配置的实现

Mar 17 Python

python中sklearn的pipeline模块实例详解

May 21 Python

Python实现一个简单的毕业生信息管理系统的示例代码

Jun 08 Python

python能自学吗

Jun 18 Python

python 使用递归的方式实现语义图片分割功能

Jul 16 Python

Python 如何实现访问者模式

Jul 28 Python

Python Django搭建文件下载服务器的实现

May 10 Python

python语言中pandas字符串分割str.split()函数

Aug 05 Python

python调用百度语音识别api

Aug 30 #Python

python实现ID3决策树算法

Aug 29 #Python

python实现C4.5决策树算法

Aug 29 #Python

python机器学习之KNN分类算法

Aug 29 #Python

深入理解python中sort()与sorted()的区别

Aug 29 #Python

Python实现拷贝/删除文件夹的方法详解

Aug 29 #Python

Python读写zip压缩文件的方法

Aug 29 #Python

You might like

在win系统安装配置 Memcached for PHP 5.3 图文教程

2015/03/03 PHP

php用正则判断是否为数字的方法

2016/03/25 PHP

PHP仿qq空间或朋友圈发布动态、评论动态、回复评论、删除动态或评论的功能（上）

2017/05/26 PHP

jQuery关于导航条背景切换效果实现示例

2013/09/04 Javascript

Js实现双击鼠标自动滚动屏幕的示例代码

2013/12/14 Javascript

jQuery如何获取同一个类标签的所有值(默认无法获取)

2014/09/25 Javascript

字符串反转_JavaScript

2016/04/28 Javascript

jquery实现超简单的瀑布流布局【推荐】

2017/03/08 Javascript

jquery实现tab选项卡切换效果（悬停、下方横线动画位移）

2017/05/05 jQuery

jquery动态赋值id与动态取id方法示例

2017/08/21 jQuery

Vue.js中对css的操作（修改）具体方式详解

2018/10/30 Javascript

JavaScript类的继承操作实例总结

2018/12/20 Javascript

jQuery实现input输入框获取焦点与失去焦点时提示的消失与显示功能示例

2019/05/27 jQuery

layer弹出层显示在top顶层的方法

2019/09/11 Javascript

vue项目打包为APP,静态资源正常显示,但API请求不到数据的操作

2020/09/12 Javascript

jQuery实现图片切换效果

2020/10/19 jQuery

Python文件去除注释的方法

2015/05/25 Python

python用Pygal如何生成漂亮的SVG图像详解

2017/02/10 Python

Python数据结构与算法之图结构（Graph）实例分析

2017/09/05 Python

python之Character string(实例讲解)

2017/09/25 Python

pandas实现选取特定索引的行

2018/04/20 Python

解决PySide+Python子线程更新UI线程的问题

2019/01/11 Python

手机使用python操作图片文件(pydroid3)过程详解

2019/09/25 Python

canvas实现图片马赛克的示例代码

2018/03/26 HTML / CSS

为你的html5网页添加音效示例

2014/04/03 HTML / CSS

英国最大的手表网站：The Watch Hut

2017/03/31 全球购物

舞会礼服和舞会鞋：PromGirl

2019/04/22 全球购物

群胜软件Java笔试题

2012/09/29 面试题

Lucene推荐的分页方式是什么？

2015/12/07 面试题

小学门卫岗位职责

2013/12/17 职场文书

会计与审计毕业生自荐信范文

2013/12/30 职场文书

买卖车协议书

2014/04/21 职场文书

奥巴马上海演讲稿

2014/09/10 职场文书

高中学生自我评价范文

2014/09/23 职场文书

商品陈列协议书

2014/09/29 职场文书

成功的商业计划书这样写才最靠谱

2019/07/12 职场文书