预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共46页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

在语音识别中的应用语音识别信息获取analysis语者无关/相关 词表大小 孤立词vs.连续语音 环境噪声等1.DynamicTimeWarping(DTW) 2.HiddenMarkovModelling(HMM) 3.Multi-layerPerceptron(MLP) AndreiA.Markov Russianstatistician 1856–1922 s1s1s1下雨问题: 连续8天的天气状况为“晴天-晴天-晴天-下雨-下雨-晴天-多云-晴天”的概率是多少? 晴天信号统计理论模型 起源于60年代后期 Baum和他的同事首先提出 Baker(CMU)和Jelinek(IBM)在70年代早期 实现在语音处理上的应用 1对比两个模型可见: 马尔可夫模型的观测序列本身就是状态序列; 隐马尔可夫模型的观测序列不是状态序列; 状态总数N; 每个状态对应的观测事件数M; 状态转移矩阵 每个状态下取所有观测事件的概率分布 起始状态 问题一:给定模型参数和观测序列,如何快速求出在该模型下,观测事件序列发生的概率? ——估计问题 问题二:给定模型参数和观测序列,如何找出一个最佳状态序列? ——解码问题 问题三:如何得到模型中的五个参数? ——学习问题估计问题:前向算法和后向算法 解码问题:Viterbi算法 学习问题:Baum-Welch算法估计问题—前向算法估计问题—前向算法State估计问题—后向算法估计问题—后向算法解码问题—Viterbi算法三硬币隐马尔可夫模型三硬币隐马尔可夫模型学习问题—Baum-Welch算法学习问题—Baum-Welch算法1.前向后向算法计算P(O|λ); 2.Baum-Welch算法求出最优解λ*=argmax{P(O|λ)}; 3.Viterbi算法解出最佳状态转移序列; 4.根据最佳状态序列对应的λ给出候选音节或声韵母 5.通过语言模型形成词和句子Baum-Welch Re-estimationSelect maximum语音信号预处理与特征提取 声学模型与模式匹配 语言模型与语言处理 语音信号预处理与特征提取语音信号预处理与特征提取语音信号预处理与特征提取语音信号预处理与特征提取特征选取: 1)幅度(或功率) 2)过零率 3)LPC预测系数特征矢量 4)LPC倒谱特征矢量(LPCC) 5)Mel倒谱参数(MFCC) 6)前三个共振峰F1、F2、F3模型基元 声韵母:声母22个,韵母38个 音节:412个音节,1282个有调音节 词参数初始化: 起始状态概率(π) 状态转移概率(A) 观测序列概率(B)DHMM: 离散的符号作为观测量 采用统计语法的语言模型 基本原理:采用大量的文本资料,统计各个词的出现概率及相互关联的条件概率,并将这些知识与声学模型结合进行结果判决,减小误识。 设W=w1,w2,…,wQ,其概率表示为: P(W)=P(w1,w2,…,wQ) =P(w1)P(w2|w1)……P(WQ|W1,W2,…WQ-1) Unigram Bigram Trigram an Hasanwhatthin Hasawatchthin 谢谢!