编程 Python

Python实现简单的语音识别系统

Posted in Python onDecember 13, 2017

最近认识了一个做Python语音识别的朋友，聊天时候说到，未来五到十年，Python人工智能会在国内掀起一股狂潮，对各种应用的冲击，不下于淘宝对实体经济的冲击。在本地（江苏某三线城市）做这一行，短期可能显不出效果，但从长远来看，绝对是一个高明的选择。朋友老家山东的，毕业来这里创业，也是十分有想法啊。

将AI课上学习的知识进行简单的整理,可以识别简单的0-9的单个语音。基本方法就是利用库函数提取mfcc,然后计算误差矩阵,再利用动态规划计算累积矩阵。并且限制了匹配路径的范围。具体的技术网上很多,不再细谈。

现有缺点就是输入的语音长度都是1s,如果不固定长度则识别效果变差。改进思路是提取有效语音部分。但是该部分尚未完全做好,只写了一个原形函数,尚未完善。

Python实现简单的语音识别系统

import wave
import numpy as np
import matplotlib.pyplot as plt
from python_speech_features import mfcc
from math import cos,sin,sqrt,pi
def read_file(file_name):
  with wave.open(file_name,'r') as file:
    params = file.getparams()
    _, _, framerate, nframes = params[:4] 
    str_data = file.readframes(nframes)
    wave_data = np.fromstring(str_data, dtype = np.short)
    time = np.arange(0, nframes) * (1.0/framerate)
    return wave_data, time 
  return index1,index2
def find_point(data):
  count1,count2 = 0,0
  for index,val in enumerate(data):
    if count1 <40:
      count1 = count1+1 if abs(val)>0.15 else 0
      index1 = index
    if count1==40 and count2 <5:
      count2 = count2+1 if abs(val)<0.001 else 0
      index2 = index
    if count2==5:break
  return index1,index2
def select_valid(data):
  start,end = find_point(normalized(data))
  print(start,end)
  return data[start:end]
def normalized(a):
  maximum = max(a)
  minimum = min(a)
  return a/maximum

def compute_mfcc_coff(file_prefix = ''):
  mfcc_feats = []
  s = range(10)
  I = [0,3,4,8]
  II = [5,7,9]
  Input = {'':s,'I':I,'II':II,'B':s}
  for index,file_name in enumerate(file_prefix+'{0}.wav'.format(i) for i in Input[file_prefix]):
    data,time = read_file(file_name)
    #data = select_valid(data)
    #if file_prefix=='II':data = select_valid(data)

    mfcc_feat = mfcc(data,48000)[:75]
    mfcc_feats.append(mfcc_feat)
  t = np.array(mfcc_feats)
  return np.array(mfcc_feats)
def create_dist():

  for i,m_i in enumerate(mfcc_coff_input):#get the mfcc of input
    for j,m_j in enumerate(mfcc_coff):#get the mfcc of dataset
      #build the distortion matrix bwtween i wav and j wav
      N = len(mfcc_coff[0])
      distortion_mat = np.array([[0]*len(m_i) for i in range(N)],dtype = np.double)
      for k1,mfcc1 in enumerate(m_i):
        for k2,mfcc2 in enumerate(m_j):
          distortion_mat[k1][k2] = sqrt(sum((mfcc1[1:]-mfcc2[1:])**2))
      yield i,j,distortion_mat

def create_Dist():

  for _i,_j,dist in create_dist():
    N = len(dist)
    Dist = np.array([[0]*N for i in range(N)],dtype = np.double)
    Dist[0][0] = dist[0][0]
    for i in range(N):
      for j in range(N):
        if i|j ==0:continue
        pos = [(i-1,j),(i,j-1),(i-1,j-1)]
        Dist[i][j] = dist[i][j] + min(Dist[k1][k2] for k1,k2 in pos if k1>-1 and k2>-1)


    #if _i==0 and _j==1 :print(_i,_j,'\n',Dist,len(Dist[0]),len(Dist[1]))
    yield _i,_j,Dist
def search_path(n):
  comparison = np.array([[0]*10 for i in range(n)],dtype = np.double)
  for _i,_j,Dist in create_Dist():
    N = len(Dist)
    cut_off = 5
    row = [(d,N-1,j) for j,d in enumerate(Dist[N-1]) if abs(N-1-j)<=cut_off]
    col = [(d,i,N-1) for i,d in enumerate(Dist[:,N-1]) if abs(N-1-i)<=cut_off]
    min_d,min_i,min_j = min(row+col )
    comparison[_i][_j] = min_d
    optimal_path_x,optimal_path_y = [min_i],[min_j]
    while min_i and min_j:
      optimal_path_x.append(min_i)
      optimal_path_y.append(min_j)
      pos = [(min_i-1,min_j),(min_i,min_j-1),(min_i-1,min_j-1)]
      #try:
      min_d,min_i,min_j = min(((Dist[int(k1)][int(k2)],k1,k2) for k1,k2 in pos\
      if abs(k1-k2)<=cut_off))

    if _i==_j and _i==4:
      plt.scatter(optimal_path_x[::-1],optimal_path_y[::-1],color = 'red')
      plt.show()
  return comparison

mfcc_coff_input = []
mfcc_coff = []

def match(pre):
  global mfcc_coff_input
  global mfcc_coff
  mfcc_coff_input = compute_mfcc_coff(pre)
  compare = np.array([[0]*10 for i in range(len(mfcc_coff_input))],dtype = np.double)
  for prefix in ['','B']:
    mfcc_coff = compute_mfcc_coff(prefix)
    compare += search_path(len(mfcc_coff_input))
  for l in compare:
    print([int(x) for x in l])
    print(min(((val,index)for index,val in enumerate(l)))[1])
data,time = read_file('8.wav')
match('I')
match('II')

总结

以上就是本文关于Python实现简单的语音识别系统的全部内容，希望对大家有所帮助。感兴趣的朋友可以继续参阅本站：

如有不足之处，欢迎留言指出。感谢朋友们对本站的支持！

Python实现简单的语音识别系统

- Author -

PYB不开心

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

仅利用30行Python代码来展示X算法

Apr 01 Python

python使用arp欺骗伪造网关的方法

Apr 24 Python

Django中URLconf和include()的协同工作方法

Jul 20 Python

基于Django filter中用contains和icontains的区别(详解)

Dec 12 Python

python中in在list和dict中查找效率的对比分析

May 04 Python

将python图片转为二进制文本的实例

Jan 24 Python

使用python来调用CAN通讯的DLL实现方法

Jul 03 Python

python+rsync精确同步指定格式文件

Aug 29 Python

Python使用正则实现计算字符串算式

Dec 29 Python

详解pandas apply 并行处理的几种方法

Feb 24 Python

基于PyInstaller各参数的含义说明

Mar 04 Python

Python可视化学习之matplotlib内置单颜色

Feb 24 Python

关于反爬虫的一些简单总结

Dec 13 #Python

Python自动化运维_文件内容差异对比分析

Dec 13 #Python

Python实现自动发送邮件功能

Mar 02 #Python

django站点管理详解

Dec 12 #Python

Django 生成登陆验证码代码分享

Dec 12 #Python

python+django加载静态网页模板解析

Dec 12 #Python

Django入门使用示例

Dec 12 #Python

You might like

解析在PHP中使用mysqli扩展库对mysql的操作

2013/07/03 PHP

php中的动态调用实例分析

2015/01/07 PHP

PHP微信刮刮卡附微信接口

2016/07/22 PHP

Yii CDBCriteria常用方法实例小结

2017/01/19 PHP

做好七件事帮你提升jQuery的性能

2014/02/06 Javascript

jQuery简单实现网页选项卡特效

2014/11/24 Javascript

jQuery实现点击图片翻页展示效果的方法

2015/02/16 Javascript

JQuery使用$.ajax和checkbox实现下次不在通知功能

2015/04/16 Javascript

使用RequireJS优化JavaScript引用代码的方法

2015/07/01 Javascript

浅析JavaScript访问对象属性和方法及区别

2015/11/16 Javascript

jQuery+css实现的换页标签栏效果

2016/01/27 Javascript

jQuery实现滚动鼠标放大缩小图片的方法(附demo源码下载)

2016/03/05 Javascript

jQuery实现下拉框功能实例代码

2016/05/06 Javascript

bootstrapfileinput实现文件自动上传

2016/11/08 Javascript

js a标签点击事件

2017/03/30 Javascript

Vue实战之vue登录验证的实现代码

2017/10/31 Javascript

React路由管理之React Router总结

2018/05/10 Javascript

javascript标准库(js的标准内置对象)总结

2018/05/26 Javascript

[27:53]2014 DOTA2华西杯精英邀请赛 5 24 NewBee VS iG

2014/05/26 DOTA

[05:53]敌法师的金色冠名ID"BurNIng"，是传说，是荣耀

2020/07/11 DOTA

[01:37]PWL S2开团时刻DAY1&2——这符有毒

2020/11/20 DOTA

Python和php通信乱码问题解决方法

2014/04/15 Python

零基础学Python（一）Python环境安装

2014/08/20 Python

python实现NB-IoT模块远程控制

2018/06/20 Python

python Tkinter的图片刷新实例

2019/06/14 Python

python实现连续变量最优分箱详解--CART算法

2019/11/22 Python

米兰网婚纱礼服法国网上商店：Milanoo法国

2016/08/20 全球购物

俄罗斯最大的隐形眼镜销售网站：Ochkov.Net

2021/02/07 全球购物

Tomcat中怎么使用log4j输出所有的log

2016/07/07 面试题

教师实习自我鉴定

2013/12/18 职场文书

建筑文秘专业个人求职信范文

2013/12/28 职场文书

小学生开学感言

2014/02/28 职场文书

道路交通事故人身损害赔偿协议书

2014/11/19 职场文书

贷款担保书范本

2015/09/22 职场文书

2016年小学生寒假总结

2015/10/10 职场文书

北京大学中文系教授推荐的10本小说

2019/08/08 职场文书