python腾讯语音合成实现过程解析


Posted in Python onAugust 01, 2019

一、腾讯语音合成介绍

腾讯云语音合成技术(TTS)可以将任意文本转化为语音,实现让机器和应用张口说话。 腾讯TTS技术可以应用到很多场景,比如,移动APP语音播报新闻;智能设备语音提醒;依靠网上现有节目或少量录音,快速合成明星语音,降低邀约成本;支持车载导航语音合成的个性化语音播报。(废话一大堆)。。。

二、腾讯语音合成python SDK文档

安装 Python SDK 前,先获取安全凭证。在第一次使用云 API 之前,用户首先需要在腾讯云控制台上申请安全凭证,安全凭证包括 SecretID 和 SecretKey, SecretID 是用于标识 API 调用者的身份,SecretKey 是用于加密签名字符串和服务器端验证签名字符串的密钥。SecretKey 必须严格保管,避免泄露。 

通过 pip 安装(推荐)

您可以通过 pip 安装方式将腾讯云 API Python SDK 安装到您的项目中,如果您的项目环境尚未安装 pip,请详细参见 pip官网 安装。

通过pip方式安装请在命令行中执行以下命令:

pip install tencentcloud-sdk-python

请注意,如果同时有 python2 和 python3 环境, python3 环境需要使用 pip3 命令安装。

三、腾讯语音合成

# !/usr/bin/env python 2 # -*- coding: utf-8 -*-
from base64 import b64decode
from uuid import uuid4
from tencentcloud.common import credential
from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException
from tencentcloud.aai.v20180522.models import TextToVoiceRequest
from tencentcloud.aai.v20180522.aai_client import AaiClient
try:
  # 实例化一个认证对象,入参需要传入腾讯云账户secretId,secretKey
  cred = credential.Credential("你的secretID", "你的secretKey")
  # 实例化要进行语音合成请求的client对象
  client = AaiClient(cred, 'ap-shanghai')
  # 实例化一个请求对象
  req = TextToVoiceRequest()
  # 请求对象属性封装
  req.Text = '先帝创业未半而中道崩殂' # type: str # 要合成语音的文本
  req.SessionId = uuid4() # type: int # 一次请求对应一个SessionId,会原样返回,建议传入类似于uuid的字符串防止重复
  req.ModelType = 1 # type: int # 模型类型,默认值为1
  req.Volume = 5.0 # type: float # 音量大小,范围:[0,10],分别对应10个等级的音量,默认为0
  req.Speed = 0.6 # type: float # 语速,范围:[-2,2],分别对应不同语速:0.6倍,0.8倍,1.0倍,1.2倍,1.5倍,默认为0
  req.ProjectId = 10086 # type: int # 项目id,用户自定义,默认为0
  req.VoiceType = 0 # type: int # 音色0:女声1,亲和风格(默认) 音色1:男声1,成熟风格 音色2:男声2,成熟风格
  req.PrimaryLanguage = 1 # type: int # 主语言类型1:中文,最大100个汉字(标点符号算一个汉字)语言类型2:英文,最大支持400个字母(标点符号算一个字母)
  req.SampleRate = 16000 # type: int # 音频采样率,16000:16k,8000:8k,默认16k
  # 通过client对象调用想要访问的接口,需要传入请求对象
  rep = client.TextToVoice(req)
  # rep为响应对象
  print(rep)
  """
    {
    "Audio": "UklGRlR/AABXQVZFZm10IBAAAAABAAEAgD4AAAB9AAACABAAZGF0YSx9AAD+////AQD//wAAAAAAAAIAAQADAAMABgAEAAYABQAGAAUABwAIAAgACQAAE......AAgACAAEAAgADAAIAAwACAAQAAwACAAIAAgADAAMAAgACAAIAAwABAAAAAAAAAAAAAAD/////AAAAAAAA//8AAP///v/9//7//v///////v8AAP///////wAA/////wAA/////wAAAAAAAAAAAAAAAAAAAAAAAAAA",
    "RequestId": "9a7a1615-3e09-4db2-8032-5c6f497f7e6a",
    "SessionId": "session-1234"
    }
    Audio对应的值为经过base64编码,
    RequestId为返回的唯一请求id,
    SessionId为发送请求时传入的id即uuid4()
  """
  # content为base64解码后的二进制流
  content = b64decode(rep.Audio)
  # I/O操作
  with open('voice.wav', 'wb') as f:
    f.write(content)
except TencentCloudSDKException as e:
  print(e)

四、腾讯语音合成使用后感受

首先,在代码层次上讲,官方压根没有合成示例文档啊(咆哮ing),全自己摸索的啊(咆哮ing),SDK都开发出来了,示例代码给一下能死啊(咆哮ing),怪不得没人用啊(咆哮ing)!

第二,还是在代码层次上讲,源码中TextToVoiceRequest()类,在__init__()方法中就不能直接封装属性啊(咆哮ing),有些没有自定制但都是默认的直接填上不就行了啊(咆哮ing),懒死你啊,非得一行一行自己加属性啊(咆哮ing),看到的同学务必要修改这个类的__init__()方法,要不然就像示例代码中那样麻烦。

第三,在合成效果上讲,声音难听爆了有木有,语音文件还得解码再I/O,吃饱了撑的了啊,还是那句话:怪不得没人用,百度语音合成效果比你强多了。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python入门篇之列表和元组
Oct 17 Python
python 环境变量和import模块导入方法(详解)
Jul 11 Python
使用python为mysql实现restful接口
Jan 05 Python
python2.7无法使用pip的解决方法(安装easy_install)
Apr 03 Python
django 修改server端口号的方法
May 14 Python
python tools实现视频的每一帧提取并保存
Mar 20 Python
给大家整理了19个pythonic的编程习惯(小结)
Sep 25 Python
python 发送json数据操作实例分析
Oct 15 Python
Python 读取WAV音频文件 画频谱的实例
Mar 14 Python
Python读取excel文件中带公式的值的实现
Apr 17 Python
python查看矩阵的行列号以及维数方式
May 22 Python
python中_del_还原数据的方法
Dec 09 Python
Python空间数据处理之GDAL读写遥感图像
Aug 01 #Python
Python生命游戏实现原理及过程解析(附源代码)
Aug 01 #Python
Python中list的交、并、差集获取方法示例
Aug 01 #Python
详解pandas使用drop_duplicates去除DataFrame重复项参数
Aug 01 #Python
Python使用Pandas对csv文件进行数据处理的方法
Aug 01 #Python
python使用writerows写csv文件产生多余空行的处理方法
Aug 01 #Python
python psutil模块使用方法解析
Aug 01 #Python
You might like
web方式ftp
2006/10/09 PHP
PHPLog php 程序调试追踪工具
2009/09/09 PHP
PHP生成推广海报的方法分享
2018/04/22 PHP
Yii框架函数简单用法分析
2019/09/09 PHP
基于JQUERY的两个ListBox子项互相调整的实现代码
2011/05/07 Javascript
javascript获取web应用根目录的方法
2014/02/12 Javascript
javascript在网页中实现读取剪贴板粘贴截图功能
2014/06/07 Javascript
javascript中clone对象详解
2014/12/03 Javascript
JS实现自动变换的菜单效果代码
2015/09/09 Javascript
基于node实现websocket协议
2016/04/25 Javascript
javascript中利用柯里化函数实现bind方法
2016/04/29 Javascript
jquery实现点击弹出可放大居中及关闭的对话框(附demo源码下载)
2016/05/10 Javascript
Bootstrap前端开发案例一
2016/06/17 Javascript
原生js封装自定义滚动条
2017/03/24 Javascript
详解vue中computed 和 watch的异同
2017/06/30 Javascript
JavaScript数据结构与算法之队列原理与用法实例详解
2017/11/22 Javascript
JavaScript之数组扁平化详解
2019/06/03 Javascript
粗略分析Python中的内存泄漏
2015/04/23 Python
详解Python3中字符串中的数字提取方法
2017/01/14 Python
python多进程中的内存复制(实例讲解)
2018/01/05 Python
Centos下实现安装Python3.6和Python2共存
2018/08/15 Python
python爬虫 基于requests模块的get请求实现详解
2019/08/20 Python
使用Python爬取弹出窗口信息的实例
2020/03/14 Python
Python ckeditor富文本编辑器代码实例解析
2020/06/22 Python
python使用ctypes库调用DLL动态链接库
2020/10/22 Python
CSS3绘制不规则图形的一些方法示例
2015/11/07 HTML / CSS
CSS3 box-shadow属性实例详解
2020/06/19 HTML / CSS
css3实现文字首尾衔接跑马灯的示例代码
2020/10/16 HTML / CSS
Nike英国官网:Nike.com (UK)
2017/02/13 全球购物
局部内部类是否可以访问非final变量?
2013/04/20 面试题
个人授权委托书
2014/04/03 职场文书
农行心得体会
2014/09/02 职场文书
奥巴马经典演讲稿
2014/09/13 职场文书
信用卡工作证明模板
2014/09/14 职场文书
2016年教师节特级教师获奖感言
2015/12/09 职场文书
台式电脑蓝牙适配器怎么安装?台式电脑蓝牙适配器安装教程
2022/04/08 数码科技