基于分数阶傅里叶变换的语音非语音检测方法-豆柴文库

基于分数阶傅里叶变换的语音非语音检测方法.pdf

2024-01-03

10金币

850KB

8页

志玉****爱啊

实名认证

内容提供者

1/8

2/8

3/8

4/8

5/8

6/8

7/8

8/8

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103578466103578466A(43)申请公布日2014.02.12(21)申请号201310557124.5(22)申请日2013.11.11(71)申请人清华大学地址100084北京市海淀区北京市100084-82信箱(72)发明人张卫强刘加(74)专利代理机构北京众合诚成知识产权代理有限公司11246代理人陈波(51)Int.Cl.G10L15/04(2013.01)权权利要求书2页利要求书2页说明书4页说明书4页附图1页附图1页(54)发明名称基于分数阶傅里叶变换的语音非语音检测方法(57)摘要本发明公开了语音信号处理领域的一种基于分数阶傅里叶变换的语音非语音检测方法。其技术方案是，首先对音频信号分帧，然后进行零均值化和加窗处理，接着对每帧信号进行不同阶次的分数阶傅里叶变换，得到其分数阶频谱，然后计算分数阶频谱熵，选择各个阶次中最大的分数阶频谱熵，与阈值进行比较即可得到判决结果。该方法处理方法统一，流程简单，可以有效提高提高语音非语音检测的性能；可以实现音频信号中静音、噪音、音乐等“垃圾”信号的有效过滤。CN103578466ACN10357846ACN103578466A权利要求书1/2页1.一种基于分数阶傅里叶变换的语音非语音检测方法，其特征在于，所述方法具体包括以下步骤：步骤1：对音频信号按帧长25ms，帧移10ms进行分帧处理；步骤2：对分帧处理后的每帧信号进行零均值化和加窗处理；步骤3：在步骤2的基础上，对每帧信号进行不同阶次的分数阶傅里叶变换，得到不同阶次的分数阶频谱；步骤4：对每一阶次的分数阶频谱，计算其分数阶频谱熵；步骤5：对不同阶次的分数阶频谱熵取最大值，并将最大值与设定的阈值进行比较，如果大于阈值，则判决为非语音；否则，判决为语音。2.根据权利要求1所述的方法，其特征在于，所述加窗处理指的是对分帧处理后的每帧信号加汉明窗或汉宁窗。3.根据权利要求1所述的方法，其特征在于，所述不同阶次的设定为：阶次从0到1，每隔0.05进行一次。4.根据权利要求1所述的方法，其特征在于，所述对每帧信号进行不同阶次的分数阶傅里叶变换的公式为：其中，x(t)是加窗后的信号，Xp(u)是信号p阶傅里叶变换，Kp(u,t)是p阶傅里叶变换的核函数，其定义为n为整数，是归一化系数，α=pπ/2；p为变换的阶次。5.根据权利要求1所述的方法，其特征在于，所述对每一阶次的分数阶频谱，计算其分数阶频谱熵的过程为：步骤401：根据分数阶频谱子带能量公式计算分数阶频谱子带能量；所述分数阶频谱子带能量公式为：其中，Lm和Um是第m个子带的下限和上限频率，共M个子带，Xp(u)为阶次为P时的分数阶频谱；步骤402：计算分数阶频谱总能量：步骤403：计算分数阶频谱熵：2CN103578466A权利要求书2/2页3CN103578466A说明书1/4页基于分数阶傅里叶变换的语音非语音检测方法技术领域[0001]本发明属于语音信号处理领域，尤其涉及一种基于分数阶傅里叶变换的语音非语音检测方法。背景技术[0002]在语音信号处理中，音频数据的预处理是非常重要的一个环节。其功能是去除语音信号之外的非语音信号，具体包括静音、噪声、音乐等，从而得到较为“干净”的语音数据，供后续模块进行处理。[0003]目前，对于静音、噪声、音乐等处理有各自的算法。例如对于静音处理，有较成熟的VAD（语音活动检测）算法，如G.723.1、子带频谱熵等算法；对于噪声处理，有较成熟的降噪或去噪算法，如小波降噪算法、维纳滤波算法；对于音乐处理，有语音音乐分类算法，如MLER（改进的低能量率）算法、GMM（高斯混合模型）算法。这些算法可以分别应对不同的非语音类型，在构建实际应用系统时，一般需要将这些模块进行串联，从而达到处理各种非语音的目的。但是这样带来的问题是系统实现复杂，处理框架不统一。发明内容[0004]针对背景技术中提到的目前存在的语音信号处理方法无法达到处理各种非语音的问题，本发明提出了一种基于分数阶傅里叶变换的语音非语音检测方法。[0005]一种基于分数阶傅里叶变换的语音非语音检测方法，其特征在于，所述方法具体包括以下步骤：[0006]步骤1：对音频信号按帧长25ms，帧移10ms进行分帧处理；[0007]步骤2：对分帧处理后的每帧信号进行零均值化和加窗处理；[0008]步骤3：在步骤2的基础上，对每帧信号进行不同阶次的分数阶傅里叶变换，得到不同阶次的分数阶频谱；[0009]步骤4：对每一阶次的分数阶频谱，计算其分数阶频谱熵；[0010]步骤5：对不同阶次的分数阶频谱熵取最大值，并将最大值与设定的阈值进行比较，如果大于阈值，则判决为非语音；否则，判决为语音。[0

相关资料

基于分数阶傅里叶变换的语音非语音检测方法.pdf

本发明公开了语音信号处理领域的一种基于分数阶傅里叶变换的语音非语音检测方法。其技术方案是，首先对音频信号分帧，然后进行零均值化和加窗处理，接着对每帧信号进行不同阶次的分数阶傅里叶变换，得到其分数阶频谱，然后计算分数阶频谱熵，选择各个阶次中最大的分数阶频谱熵，与阈值进行比较即可得到判决结果。该方法处理方法统一，流程简单，可以有效提高提高语音非语音检测的性能；可以实现音频信号中静音、噪音、音乐等“垃圾”信号的有效过滤。

2024-01-03

850KB

基于分数阶傅里叶变换的目标特征提取方法.pdf

本发明公开了一种基于分数阶傅里叶变换理论的特征提取方法，主要解决现有技术在对三类飞机目标分类过程的特征提取中特征单一且分类效果不理想的问题。其技术方案是：1、对训练信号做分数阶傅里叶变换；2、对变换后的训练信号提取特征；3、对提取出的特征进行特征选择；4、用选出特征对分类器进行训练；5、对测试信号做分数阶傅里叶变换；6、对变换后测试信号提取步骤3中所选出特征；7、把从测试信号中提取的特征送入到训练好的分类器中，完成对三类飞机目标的分类。本发明将传统的时域和多普勒域特征扩展到分数域，能够更好地描述目标回波特

2023-11-02

1.5MB

基于分数阶傅里叶变换和小波变换的多普勒心率估计方法.pdf

本发明公开了一种基于分数阶傅里叶变换和小波变换的多普勒心率估计方法，包括以下步骤：S1.对解调后的回波信号分别进行不同阶数的分数阶傅里叶变换，形成二维分数阶平面；S2.根据呼吸信号、高阶呼吸谐波的峰值在平面内的分布规律，依次识别和抑制呼吸信号、高阶呼吸谐波，并完成心跳信号的提取；S3.基于小波变换的实时心率估计算法，对提取的心跳信号进行小波变换，利用所得小波系数在时间轴上的累加得到小波频谱图，完成实时心率估计。本发明不仅可以保证多普勒生命体征检测系统的非接触和低廉和简洁性和探测实时性，还可以抑制呼吸谐波干

2023-11-01

991KB

基于分数阶傅里叶变换的激光雷达微弱信号提取和分解方法.pdf

本发明公开了一种基于分数阶傅里叶变换的激光雷达微弱信号提取和分解方法，属于激光雷达信号处理技术领域。该方法首先对含噪激光雷达回波信号进行分数阶傅里叶变换，获得FRFT谱，由一维信号转换为二维图像。第二，采用均值滤波、小波滤波及巴特沃兹滤波的复合滤波方法，对FRFT谱进行图像增强。第三，对增强后的FRFT谱图像数据聚类，确定聚类数量并分离各聚类数据。第四，对分离的各聚类数据进行位置和强度统计，筛选有效数据点后对保留数据进行最小二乘法拟合，获得飞行时间、脉宽和幅值，完成激光雷达回波信号提取与成分分解。本发明为

2023-11-17

1.6MB

分数阶傅里叶变换的离散算法.pptx

一、分数阶Fourier变换的定义二、分数阶与其他时频分析工具（Wigner-Ville分布）的关系三、离散分数阶傅立叶变换的计算一、分数阶Fourier变换的定义二、分数阶傅里叶变换与Wigner-Ville分布经过一系列变换后变为所以分数阶Fourier变换有一个重要的性质，分数阶Fourier变换是角度为α的时频面旋转.这个性质建立起分数阶Fourier变换与时频分布间的直接联系,并且为分数阶Fourier域理解为一种统一的时频变换域奠定了理论基础,同时也为分数阶Fourier变换在信号处理领域中的

2024-01-26

1MB