自训练过完备字典和稀疏表示的语音增强-豆柴文库

自训练过完备字典和稀疏表示的语音增强.docx

2023-11-19

10金币

23KB

10页

是你****晨呀

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

自训练过完备字典和稀疏表示的语音增强摘要：提出的算法利用带噪信号进行训练以获得过完备字典通过设定较大的字典训练阈值训练过程只对语音信号进行使得自训练字典与语音信号之间相关性较强。利用该字典和较小的阈值对语音信号进行稀疏表示进而实现语音增强。仿真实验表明增强后的信号表示系数稀疏度更强增强效果在信噪比（SNR）和感知语音质量评估（PESQ）得分方面均有较大改进。关键词：正交匹配追踪；迭代阈值；字典训练；语音增强中图分类号：TN912.3?34文献标识码：A文章编号：1004?373X（2015）13?0056?03Abstract：Intheproposedalgorithmthedictionaryistrainedbythesignalwithnoisetoobtainover?completedictionary.Bysettingthebiggerdictionarytrainingthresholdthecorrelationbetweenself?trainingdictionaryandspeechsignalstrongerisenhanced.Thetrainingprocessaimstospeechsignalonly.Thedictionaryandthesmallerthresholdareusedtoconductsparserepresentationofspeechsignalandthenspeechenhancementisrealized.Simulationexperimentresultsshowthattheexpressioncoefficientsparsityoftheenhancedsignalisstrongertheenhancementeffectsaregreatlyimprovedinscoringaspectofsignal?to?noiseratio（SNR）andperceptualevaluationofspeechquality（PESQ）.Keywords：orthogonalmatchingtracking；iterativethreshold；dictionarytraining；speechenhancement0引言语音信号是人类交流过程中最自然、最常用的方式语音增强能降低噪声提高信噪比是语音信号预处理的一个重要过程。在稀疏表示中利用过完备字典中少数原子的线性组合来表示样本信号其优势是有更大的灵活性和噪声情况下更强的稳定性因而成为目前研究较多的算法在语音压缩[1]、识别[2]以及语音增强[3?4]方面均得到较为广泛的应用。在基于稀疏表示的语音增强中过完备字典的构成起着一个非常关键的作用[5]良好的字典能够使纯净语音信号的表示更加稀疏从而与噪声的区分度更为显著。在这个过程中为了得到更为稀疏的系数所采用的字典从过完备离散余弦变换、过完备小波变换等固定字典到参数化字典设计进而采用自适应字典学习算法训练字典使字典与被处理信号之间的相关性增强[6?7]。文献[8]利用纯净信号训练字典将语音激活检测估计的噪声作为重构阈值对含噪语音进行稀疏分解将系数与字典重构得到无噪的语音信号。然而在语音增强处理的过程中目标语音是受到噪声污染的纯净语音只能是其他语音信号。本文算法利用阈值正交匹配追踪（OMP）和K奇异值分解算法（K?svd）直接对含噪语音进行字典训练得到的字典与语音信号有更强的相关度因而得到的表示系数更为稀疏在语音增强时取得更好的效果。1带噪语音信号的稀疏重构设观测到的带噪语音信号为：[y（n）=x（n）+z（n）]式中：[z（n）]是方差为[σ2]的高斯白噪声；[x（n）]表示纯净语音信号；[n]表示各样值所在时刻（为表达方便以下省去[n]）。在无噪情况下分帧后的纯净语音信号[x∈RM×N]是帧长为[M]帧数为[N]的信号。对于一个过完备字典[D∈RM×L][L>M]表示字典的冗余性。[x]可以在该字典下表示为：[x=D*A]（1）式中：[A]是系数它是一个[L×N]的矩阵各列矢量[A（：n）0?M]其中[1≤n≤N；][0]代表0?范数。在稀疏表示中每帧语音信号的非0系数个数远小于信号长度。对于一个适合的过完备字典[D]语音成分在其上的系数是稀疏的

相关资料

自训练过完备字典和稀疏表示的语音增强.docx

2023-11-19

23KB

基于数据驱动字典和稀疏表示的语音增强.pdf

万方数据基于数据驱动字典和稀疏表示的语音增强孙林慧杨震mpo∞dSpeechEnhancementBasedData·DrivenDictionaryandSparseRepresentationalgorithm．And引言Wimle明Communication语音通信过程中不可避免会受到周围环境噪声的干扰，这些干扰使接收到的语音为被噪声污染的带噪信号。语音增强是解决噪声污染的有效办法，其主要任务是从带噪语音中恢复出原始纯净语音信号，改善语音质量，是噪声背景下进行语音识别和参数编码不可缺少的一部份。常用

2024-08-28

1.9MB

基于稀疏表示和字典学习的语音增强算法研究的中期报告.docx

基于稀疏表示和字典学习的语音增强算法研究的中期报告1.研究背景和意义语音增强算法是一项重要的研究领域，在实际应用中能够有效地提高语音识别和语音合成等任务的性能。传统的语音增强算法主要基于滤波、频域分析等方法，但这些方法对于噪声的去除效果有限，且可能会损失语音信号本身的信息。近年来，基于稀疏表示和字典学习的语音增强算法受到了广泛关注。通过将语音信号转换为稀疏表示，可以有效地区分语音信号和噪声，并采用字典学习的方法寻找最优的表示形式，从而实现噪声的抑制和语音信号的恢复。本文旨在探究基于稀疏表示和字典学习的语音

2024-09-13

11KB

一种基于联合字典学习和稀疏表示的单通道语音增强方法.pdf

本发明提供一种基于联合字典学习和稀疏表示的单通道语音增强方法，对干净语音做双树复数小波变换得到一组子带信号，对子带信号做短时傅里叶变换得到其时频谱，利用其幅度、实部和虚部以及语音稀疏性学习出干净语音的联合字典，同样学习出干净噪声的联合字典；对带噪语音做双树复数小波变换和短时傅里叶变换，获得每个子带信号时频谱，保留相位和实部虚部符号，提取幅度、实部和虚部绝对值并分别在干净语音和干净噪声联合字典上投影，得到语音和噪声的稀疏表示系数，利用该系数、时频谱相位和实部虚部符号以及掩码、权值等，得到该子带语音时频谱的最

2023-11-13

1.5MB

基于稀疏表示的语音增强方法研究.doc

基于稀疏表示的语音增强方法研究语音在通信过程中不可避免的受到周围环境噪声的干扰，噪声过大时不仅使人们听不清对方的谈话内容，还容易使人们疲劳，产生烦躁的情绪。所以在接收端要进行去噪声处理，这就是语音增强技术或噪声抑制技术。在不引入新的噪声前提下如何有效的去除噪声又能保持语音不失真是语音增强的目的，从而提高语音信号的质量和可懂度。提高语音质量可以减少听者的疲劳，提高可懂度可以减少失真。语音增强广泛应用于语音识别、语音编码等系统中。在免提设备、助听器等领域的应用也越来越多。除此之外，在人机对话、机器翻译、蓝牙、

2024-06-01

16KB