博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
基于深度神经网络的语音识别方法
阅读量:6689 次
发布时间:2019-06-25

本文共 673 字,大约阅读时间需要 2 分钟。

hot3.png

Kaldi 语音工具箱的简介

Kaldi 语音工具箱[61]是由微软研究院Povey 等人研究的应用于语音识别方面的开源工具箱。该工具箱是用 C++编写而成的,而且具有灵活性、扩展性。 

该工具箱的函数库是 HTK 工具箱函数库的增强版,为了使用的方便,将 HTK 零碎的的指令与功能函数模块进行统一的整合,最大的优点就是引入了深度神经网络模块。

Kaldi 工具箱的语音识别系统框架如图

175520_SYrS_2352897.png

图  中,Kaldi 系统的外部库依赖于 Open FST 和数值代数库。这两个函数库可通过 Decodable 

进行链接。

利用 C++编写指令行直接调用工具箱中的库函数,然后利用多个的 perl 语言脚本搭建成了语音识别系统。各个特定的指令行能完成相应的任务,而且只要设定少量的参数。除此之外,所有的工具模块都可以从管道接口处自由的读写,从而使得各个工具模块之间的调用更加方便。

基于 Kaldi 具体实现 DNN 训练过程

尽管深度神经网络比浅层网络有较强的建模能力,但是训练深度网络是非常困难的。因为很难判断给定的输入数据矢量后,隐含变量服从的后验概率分布。简单的 BP算法由于出现局部最小值而不能处理。最近提出使用 RBM 进行预训练和使用对比散度算法进行区分性的微调。

DBN 可以看作复杂的非线性特征提取器。每一层的隐藏单元代表特性。特征提取器能够获得与在原始的输入数据更高阶相关性的数据。利用 Kaldi工具箱具体实现 DNN 训练过程如图所示。 
 
 

转载于:https://my.oschina.net/u/2352897/blog/693079

你可能感兴趣的文章
视差滚动(Parallax Scrolling)效果的原理和实现
查看>>
带监督的文本分类算法FastText
查看>>
新书推荐:细说PHP(含样章试读)
查看>>
《黑客防线》2010合订本(下半年)
查看>>
intel I7平台Win7 x64 下wpf、silverlight 与aero特效动画缓慢故障排除一则
查看>>
shell常识总结
查看>>
内存池版本1--单线程-固定大小专为某类设计的内存池
查看>>
大道至简,职场上做人做事做管理
查看>>
《C++必知必会》读书笔记2
查看>>
web 学习资源整理
查看>>
make 参数定义
查看>>
java从字符串中提取数字
查看>>
Android深入浅出系列之服务机制—1.Android中的Service
查看>>
zz:彻底解决兼容性问题:Windows 7下载安装 Visual C++ 6.0(VC6)
查看>>
MVC、MVP以及Model2[上篇]
查看>>
面试总结,坚定自己的想法
查看>>
数据库隐式类型转换
查看>>
解决WCF调用多次之后没有响应的问题 转
查看>>
【BZOJ2318】【spoj4060】game with probability Problem 概率DP
查看>>
空格&nbsp在不同浏览器中显示距离不一致问题解决方法
查看>>