python腾讯语音合成实现过程解析


Posted in Python onAugust 01, 2019

一、腾讯语音合成介绍

腾讯云语音合成技术(TTS)可以将任意文本转化为语音,实现让机器和应用张口说话。 腾讯TTS技术可以应用到很多场景,比如,移动APP语音播报新闻;智能设备语音提醒;依靠网上现有节目或少量录音,快速合成明星语音,降低邀约成本;支持车载导航语音合成的个性化语音播报。(废话一大堆)。。。

二、腾讯语音合成python SDK文档

安装 Python SDK 前,先获取安全凭证。在第一次使用云 API 之前,用户首先需要在腾讯云控制台上申请安全凭证,安全凭证包括 SecretID 和 SecretKey, SecretID 是用于标识 API 调用者的身份,SecretKey 是用于加密签名字符串和服务器端验证签名字符串的密钥。SecretKey 必须严格保管,避免泄露。 

通过 pip 安装(推荐)

您可以通过 pip 安装方式将腾讯云 API Python SDK 安装到您的项目中,如果您的项目环境尚未安装 pip,请详细参见 pip官网 安装。

通过pip方式安装请在命令行中执行以下命令:

pip install tencentcloud-sdk-python

请注意,如果同时有 python2 和 python3 环境, python3 环境需要使用 pip3 命令安装。

三、腾讯语音合成

# !/usr/bin/env python 2 # -*- coding: utf-8 -*-
from base64 import b64decode
from uuid import uuid4
from tencentcloud.common import credential
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.aai.v20180522.models import TextToVoiceRequest
from tencentcloud.aai.v20180522.aai_client import AaiClient
try:
  # 实例化一个认证对象,入参需要传入腾讯云账户secretId,secretKey
  cred = credential.Credential("你的secretID", "你的secretKey")
  # 实例化要进行语音合成请求的client对象
  client = AaiClient(cred, 'ap-shanghai')
  # 实例化一个请求对象
  req = TextToVoiceRequest()
  # 请求对象属性封装
  req.Text = '先帝创业未半而中道崩殂' # type: str # 要合成语音的文本
  req.SessionId = uuid4() # type: int # 一次请求对应一个SessionId,会原样返回,建议传入类似于uuid的字符串防止重复
  req.ModelType = 1 # type: int # 模型类型,默认值为1
  req.Volume = 5.0 # type: float # 音量大小,范围:[0,10],分别对应10个等级的音量,默认为0
  req.Speed = 0.6 # type: float # 语速,范围:[-2,2],分别对应不同语速:0.6倍,0.8倍,1.0倍,1.2倍,1.5倍,默认为0
  req.ProjectId = 10086 # type: int # 项目id,用户自定义,默认为0
  req.VoiceType = 0 # type: int # 音色0:女声1,亲和风格(默认) 音色1:男声1,成熟风格 音色2:男声2,成熟风格
  req.PrimaryLanguage = 1 # type: int # 主语言类型1:中文,最大100个汉字(标点符号算一个汉字)语言类型2:英文,最大支持400个字母(标点符号算一个字母)
  req.SampleRate = 16000 # type: int # 音频采样率,16000:16k,8000:8k,默认16k
  # 通过client对象调用想要访问的接口,需要传入请求对象
  rep = client.TextToVoice(req)
  # rep为响应对象
  print(rep)
  """
    {
    "Audio": "UklGRlR/AABXQVZFZm10IBAAAAABAAEAgD4AAAB9AAACABAAZGF0YSx9AAD+////AQD//wAAAAAAAAIAAQADAAMABgAEAAYABQAGAAUABwAIAAgACQAAE......AAgACAAEAAgADAAIAAwACAAQAAwACAAIAAgADAAMAAgACAAIAAwABAAAAAAAAAAAAAAD/////AAAAAAAA//8AAP///v/9//7//v///////v8AAP///////wAA/////wAA/////wAAAAAAAAAAAAAAAAAAAAAAAAAA",
    "RequestId": "9a7a1615-3e09-4db2-8032-5c6f497f7e6a",
    "SessionId": "session-1234"
    }
    Audio对应的值为经过base64编码,
    RequestId为返回的唯一请求id,
    SessionId为发送请求时传入的id即uuid4()
  """
  # content为base64解码后的二进制流
  content = b64decode(rep.Audio)
  # I/O操作
  with open('voice.wav', 'wb') as f:
    f.write(content)
except TencentCloudSDKException as e:
  print(e)

四、腾讯语音合成使用后感受

首先,在代码层次上讲,官方压根没有合成示例文档啊(咆哮ing),全自己摸索的啊(咆哮ing),SDK都开发出来了,示例代码给一下能死啊(咆哮ing),怪不得没人用啊(咆哮ing)!

第二,还是在代码层次上讲,源码中TextToVoiceRequest()类,在__init__()方法中就不能直接封装属性啊(咆哮ing),有些没有自定制但都是默认的直接填上不就行了啊(咆哮ing),懒死你啊,非得一行一行自己加属性啊(咆哮ing),看到的同学务必要修改这个类的__init__()方法,要不然就像示例代码中那样麻烦。

第三,在合成效果上讲,声音难听爆了有木有,语音文件还得解码再I/O,吃饱了撑的了啊,还是那句话:怪不得没人用,百度语音合成效果比你强多了。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python多重继承新算法C3介绍
Sep 28 Python
Python的批量远程管理和部署工具Fabric用法实例
Jan 23 Python
分享Python文本生成二维码实例
Jan 06 Python
tensorflow 使用flags定义命令行参数的方法
Apr 23 Python
python自动登录12306并自动点击验证码完成登录的实现源代码
Apr 25 Python
Python3 读、写Excel文件的操作方法
Oct 20 Python
python调用matlab的m自定义函数方法
Feb 18 Python
Python使用tkinter模块实现推箱子游戏
Oct 08 Python
IronPython连接MySQL的方法步骤
Dec 27 Python
将pymysql获取到的数据类型是tuple转化为pandas方式
May 15 Python
8种常用的Python工具
Aug 05 Python
Python 利用argparse模块实现脚本命令行参数解析
Dec 28 Python
Python空间数据处理之GDAL读写遥感图像
Aug 01 #Python
Python生命游戏实现原理及过程解析(附源代码)
Aug 01 #Python
Python中list的交、并、差集获取方法示例
Aug 01 #Python
详解pandas使用drop_duplicates去除DataFrame重复项参数
Aug 01 #Python
Python使用Pandas对csv文件进行数据处理的方法
Aug 01 #Python
python使用writerows写csv文件产生多余空行的处理方法
Aug 01 #Python
python psutil模块使用方法解析
Aug 01 #Python
You might like
在任意字符集下正常显示网页的方法一
2007/04/01 PHP
PHP 翻页 实例代码
2009/08/07 PHP
php生成数组的使用示例 php全组合算法
2014/01/16 PHP
PHP实现数组递归转义的方法
2014/08/28 PHP
php导出中文内容excel文件类实例
2015/07/06 PHP
PHP后台微信支付和支付宝支付开发
2017/04/28 PHP
php实现构建排除当前元素的乘积数组方法
2018/10/06 PHP
网页图片延时加载的js代码
2010/04/22 Javascript
利用location.hash实现跨域iframe自适应
2010/05/04 Javascript
基于Jquery实现的一个图片滚动切换
2012/06/21 Javascript
jquery获取div宽度的实现思路与代码
2013/01/13 Javascript
JavaScript中的noscript元素属性位置及作用介绍
2013/04/11 Javascript
可以用鼠标拖动的DIV实现思路及代码
2013/10/21 Javascript
开发插件的两个方法jquery.fn.extend与jquery.extend
2013/11/21 Javascript
全系IE支持Bootstrap的解决方法
2015/10/19 Javascript
js实现随机抽选效果、随机抽选红色球效果
2017/01/13 Javascript
Angular-Ui-Router+ocLazyLoad动态加载脚本示例
2017/03/02 Javascript
基于angular2 的 http服务封装的实例代码
2017/06/29 Javascript
图文介绍Vue父组件向子组件传值
2018/02/17 Javascript
在Vue项目中引入腾讯验证码服务的教程
2018/04/03 Javascript
Vue 组件参数校验与非props特性的方法
2019/02/12 Javascript
JavaScript onclick事件使用方法详解
2020/05/15 Javascript
对vue生命周期的深入理解
2020/12/03 Vue.js
python安装教程
2018/02/28 Python
Python Pandas 如何shuffle(打乱)数据
2019/07/30 Python
python正则表达式 匹配反斜杠的操作方法
2020/08/07 Python
详解python中的闭包
2020/09/07 Python
把富文本的回车转为br标签
2019/08/09 HTML / CSS
德购商城:德国进口直邮商城
2017/06/13 全球购物
Tarte Cosmetics官网:美国最受欢迎的化妆品公司之一
2017/08/24 全球购物
俄语翻译实习生的自我评价分享
2013/11/06 职场文书
迎元旦广播稿
2014/02/22 职场文书
企业党员公开承诺书
2014/03/26 职场文书
就业协议书
2014/09/12 职场文书
2015年复活节活动总结
2015/02/27 职场文书
Go语言应该什么情况使用指针
2021/07/25 Golang