编程 Python

python开发一款翻译工具

Posted in Python onOctober 10, 2020

最近，某水果手机厂在万众期待中开了一场没有发布万众期待的手机产品的发布会，发布了除手机外的其他一些产品，也包括最新的水果14系统。几天后，更新了系统的吃瓜群众经过把玩突然发现新系统里一个超有意思的功能——翻译，比如这种：

python开发一款翻译工具

奇怪的翻译知识增加了！

相比常见的翻译工具，同声翻译工具更具有实用价值，想想不精通其他语言就能和歪果朋友无障碍交流的场景，真是一件美事，不如自己动手实现个工具备用!一个同声翻译工具，逻辑大概可以是先识别，而后翻译，翻译能否成功，识别的准确率是个关键因素。为了降低难度，我决定分两次完成工具开发。首先来实现试试语音识别的部分。

轻车熟路，本次的demo继续调用有道智云API，实现实时语音识别。

效果展示

先看看界面和结果哈：

可以选择多种语音，这里只写了四种常见的：

python开发一款翻译工具

偶分别测试的中文、韩文、英文。看着还不错哦~

python开发一款翻译工具

调用API接口的准备工作

首先，是需要在有道智云的个人页面上创建实例、创建应用、绑定应用和实例，获取调用接口用到的应用的id和密钥。具体个人注册的过程和应用创建过程详见文章分享一次批量文件翻译的开发过程

python开发一款翻译工具

开发过程详细介绍

下面介绍具体的代码开发过程。

首先是根据实时语音识别文档来分析接口的输入输出。接口设计的目的是对连续音频流的实时识别，转换成文本信息并返对应文字流，因此通信采用websocket，调用过程分为认证、实时通信两阶段。

在认证阶段，需发送以下参数：

参数	类型	必填	说明	示例
appKey	String	是	已申请的应用ID	ID
salt	String	是	UUID	UUID
curtime	String	是	时间戳（秒）	TimeStamp
sign	String	是	加密数字签名。	sha256
signType	String	是	数字签名类型	v4
langType	String	是	语言选择，参考支持语言列表	zh-CHS
format	String	是	音频格式，支持wav	wav
channel	String	是	声道，支持1（单声道）	1
version	String	是	api版本	v1
rate	String	是	采样率	16000

签名sign生成方法如下：
signType=v4；
sign=sha256(应用ID+salt+curtime+应用密钥)。

认证之后，就进入了实时通信阶段，发送音频流，获取识别结果，最后发送结束标志结束通信，这里需要注意的是，发送的音频最好是16bit位深的单声道、16k采样率的清晰的wav音频文件，这里我开发时最开始因为音频录制设备有问题，导致音频效果极差，接口一直返回错误码304（手动捂脸）。

Demo开发：

这个demo使用python3开发，包括maindow.py，audioandprocess.py，recobynetease.py三个文件。界面部分，使用python自带的tkinter库，来进行语言选择、录音开始、录音停止并识别的操作。audioandprocess.py实现了录音、音频处理的逻辑，最后通过recobynetease.py中的方法来调用实时语音识别API。

1.界面部分：

主要元素：

root=tk.Tk()
root.title("netease youdao translation test")
frm = tk.Frame(root)
frm.grid(padx='80', pady='80')
# label1=tk.Label(frm,text="选择待翻译文件：")
# label1.grid(row=0,column=0)
label=tk.Label(frm,text='选择语言类型：')
label.grid(row=0,column=0)
combox=ttk.Combobox(frm,textvariable=tk.StringVar(),width=38)
combox["value"]=lang_type_dict
combox.current(0)
combox.bind("<<ComboboxSelected>>",get_lang_type)
combox.grid(row=0,column=1)

btn_start_rec = tk.Button(frm, text='开始录音', command=start_rec)
btn_start_rec.grid(row=2, column=0)

lb_Status = tk.Label(frm, text='Ready', anchor='w', fg='green')
lb_Status.grid(row=2,column=1)

btn_sure=tk.Button(frm,text="结束并识别",command=get_result)
btn_sure.grid(row=3,column=0)

root.mainloop()

2.音频录制部分，引入pyaudio库（需通过pip安装）来调用音频设备，录制接口要求的wav文件，并通过wave库存储文件：

def __init__(self, audio_path, language_type,is_recording):
 self.audio_path = audio_path,
 self.audio_file_name=''
 self.language_type = language_type,
 self.language=language_dict[language_type]
 print(language_dict[language_type])
 self.is_recording=is_recording
 self.audio_chunk_size=1600
 self.audio_channels=1
 self.audio_format=pyaudio.paInt16
 self.audio_rate=16000

def record_and_save(self):
 self.is_recording = True
 # self.audio_file_name=self.audio_path+'/recordtmp.wav'
 self.audio_file_name='/recordtmp.wav'

 threading.Thread(target=self.record,args=(self.audio_file_name,)).start()

def record(self,file_name):
 print(file_name)
 p=pyaudio.PyAudio()
 stream=p.open(
 format=self.audio_format,
 channels=self.audio_channels,
 rate=self.audio_rate,
 input=True,
 frames_per_buffer=self.audio_chunk_size
 )
 wf = wave.open(file_name, 'wb')
 wf.setnchannels(self.audio_channels)
 wf.setsampwidth(p.get_sample_size(self.audio_format))
 wf.setframerate(self.audio_rate)

 # 读取数据写入文件
 while self.is_recording:
 data = stream.read(self.audio_chunk_size)
 wf.writeframes(data)
 wf.close()
 stream.stop_stream()
 stream.close()
 p.terminate()

3.翻译接口调用部分：

def recognise(filepath,language_type):
 global file_path
 file_path=filepath
 nonce = str(uuid.uuid1())
 curtime = str(int(time.time()))
 signStr = app_key + nonce + curtime + app_secret
 print(signStr)
 sign = encrypt(signStr)

 uri = "wss://openapi.youdao.com/stream_asropenapi?appKey=" + app_key + "&salt=" + nonce + "&curtime=" + curtime + \
  "&sign=" + sign + "&version=v1&channel=1&format=wav&signType=v4&rate=16000&langType=" + language_type
 print(uri)
 start(uri, 1600)


def encrypt(signStr):
 hash = hashlib.sha256()
 hash.update(signStr.encode('utf-8'))
 return hash.hexdigest()



def on_message(ws, message):
 result=json.loads(message)
 try:
 resultmessage1 = result['result'][0]
 resultmessage2 = resultmessage1["st"]['sentence']
 print(resultmessage2)
 except Exception as e:
 print('')

def on_error(ws, error):
 print(error)


def on_close(ws):
 print("### closed ###")


def on_open(ws):
 count = 0
 file_object = open(file_path, 'rb')
 while True:
 chunk_data = file_object.read(1600)
 ws.send(chunk_data, websocket.ABNF.OPCODE_BINARY)
 time.sleep(0.05)
 count = count + 1
 if not chunk_data:
  break
 print(count)
 ws.send('{\"end\": \"true\"}', websocket.ABNF.OPCODE_BINARY)



def start(uri,step):

 websocket.enableTrace(True)

 ws = websocket.WebSocketApp(uri,
    on_message=on_message,
    on_error=on_error,
    on_close=on_close)

 ws.on_open = on_open
 ws.run_forever()

总结

有道智云提供的接口一如既往的好用，这次开发主要的精力全都浪费在了由于我自己录制的音频质量差而识别失败的问题上，音频质量ok后，识别结果准确无误，下一步就是拿去翻译了，有了有道智云API，实现实时翻译也可以如此简单！

以上就是python开发一款翻译工具的详细内容，更多关于python开发翻译工具的资料请关注三水点靠木其它相关文章！

python开发一款翻译工具

- Author -

无毁的湖光-Al

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python并发编程协程(Coroutine)之Gevent详解

Dec 27 Python

分析Python读取文件时的路径问题

Feb 11 Python

python 删除非空文件夹的实例

Apr 26 Python

python读取图片并修改格式与大小的方法

Jul 24 Python

windows系统中Python多版本与jupyter notebook使用虚拟环境的过程

May 15 Python

在python image 中安装中文字体的实现方法

Aug 22 Python

python中自带的三个装饰器的实现

Nov 08 Python

通过实例解析Python调用json模块

Dec 11 Python

使用python实现多维数据降维操作

Feb 24 Python

卸载tensorflow-cpu重装tensorflow-gpu操作

Jun 23 Python

python 偷懒技巧——使用 keyboard 录制键盘事件

Sep 21 Python

python中最小二乘法详细讲解

Feb 19 Python

Python pickle模块常用方法代码实例

Oct 10 #Python

Python3.9新特性详解

Oct 10 #Python

Python random模块的使用示例

Oct 10 #Python

python 装饰器的使用示例

Oct 10 #Python

python使用bs4爬取boss直聘静态页面

Oct 10 #Python

通过案例解析python鸭子类型相关原理

Oct 10 #Python

通过实例解析python subprocess模块原理及用法

Oct 10 #Python

You might like

PHP用户指南-cookies部分

2006/10/09 PHP

php导出csv数据在浏览器中输出提供下载或保存到文件的示例

2014/04/24 PHP

PHP7.0安装笔记整理

2015/08/28 PHP

PHP获取页面执行时间的方法（推荐）

2016/12/10 PHP

PHP redis实现超迷你全文检索

2017/03/04 PHP

TP5框架实现签到功能的方法分析

2020/04/05 PHP

php7连接MySQL实现简易查询程序的方法

2020/10/13 PHP

简短几句通俗解释javascript的闭包

2011/01/17 Javascript

CodeMirror2 IE7/IE8 下面未知运行时错误的解决方法

2012/03/29 Javascript

Window.Open如何在同一个标签页打开

2014/06/20 Javascript

jquery代码实现简单的随机图片瀑布流效果

2015/04/20 Javascript

JavaScript知识点总结(十六)之Javascript闭包（Closure）代码详解

2016/05/31 Javascript

微信小程序开发（二）图片上传+服务端接收详解

2017/01/11 Javascript

Angular2中select用法之设置默认值与事件详解

2017/05/07 Javascript

Bootstrap Table 搜索框和查询功能

2017/11/30 Javascript

重学 JS：为啥 await 不能用在 forEach 中详解

2019/04/15 Javascript

轻松学习JavaScript函数中的 Rest 参数

2019/05/30 Javascript

详解node登录接口之密码错误限制次数(含代码)

2019/10/25 Javascript

vue使用better-scroll实现滑动以及左右联动

2020/06/30 Javascript

[48:48]2014 DOTA2国际邀请赛中国区预选赛 SPD-GAMING VS Dream TIME

2014/05/21 DOTA

Python 文件处理注意事项总结

2017/04/10 Python

浅谈python中的__init__、__new__和__call__方法

2017/07/18 Python

Ubuntu下Python2与Python3的共存问题

2018/10/31 Python

如何使用python把ppt转换成pdf

2019/06/29 Python

Python中低维数组填充高维数组的实现

2019/12/02 Python

python入门之井字棋小游戏

2020/03/05 Python

Python Django路径配置实现过程解析

2020/11/05 Python

CSS3中颜色线性渐变实战

2015/07/18 HTML / CSS

毕业生自荐信格式

2014/03/07 职场文书

幼儿园安全责任书

2014/04/14 职场文书

平安建设工作方案

2014/06/02 职场文书

2014年重阳节敬老活动方案

2014/09/16 职场文书

2014年小学教导处工作总结

2014/12/19 职场文书

社区结对共建协议书

2016/03/23 职场文书

详解Redis主从复制实践

2021/05/19 Redis

Python几种酷炫的进度条的方式

2022/04/11 Python