预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107564543A(43)申请公布日2018.01.09(21)申请号201710822706.X(22)申请日2017.09.13(71)申请人苏州大学地址215006江苏省苏州市十梓街1号(72)发明人肖仲喆陶智陈颖张晓俊吴迪(74)专利代理机构北京修典盛世知识产权代理事务所(特殊普通合伙)11424代理人杨方成(51)Int.Cl.G10L25/63(2013.01)G10L25/27(2013.01)G10L25/03(2013.01)G10L25/18(2013.01)权利要求书3页说明书8页附图5页(54)发明名称一种高情感区分度的语音特征提取方法(57)摘要本发明公开了一种高情感区分度的语音特征提取方法,包括:进行常规的语谱图提取,即对语音信号分帧后,对各帧数据进行离散傅里叶变换DFT,以频谱幅度值作为灰度值,得到语谱图。对语谱图进行预滤波后,进行稀疏化处理,提取其最高若干条能量峰值曲线,并对所提取的曲线结果进行频率位置信息去除,仅保留其幅度,以消除语音内容的影响,然后进行第二层离散傅里叶变换,生成语音二重谱,可以保留具有高情感区分度的信息。本发明解决了现有技术中在语音识别过程中,语音信息部分细节信息被淹没,同时由于语音特征中包含大量与语音内容有关的信息而造成情感区分度有限的技术问题。CN107564543ACN107564543A权利要求书1/3页1.一种高情感区分度的语音特征提取方法,其特征在于,包括以下步骤:步骤一、从语音信号中提取语谱图STG(i,k),i为时间轴序号,k为设定的第一频率f1的轴序号;步骤二、对语谱图STG(i,k)进行稀疏化处理,取语谱图中峰值位置幅度最大的v个峰值位置,并将这些峰值点沿时域方向形成峰值轨迹;步骤三、对峰值轨迹位置进行差分运算,得到v-1个频率差分值,以投票方式确定各次谐波间频率差Dh(i),计算各次谐波在设定邻域内的均值,组合成前v次谐波强度轨迹,以去除语音内容的影响,设定q为谐波次数,q=1,2,…v;步骤四、设置第二频率f2的分辨率,确定第二级傅立叶变换的计算点数N2,计算第q条谐波强度轨迹的第二频率频谱,将v条强度轨迹的第二频率频谱去除相位,仅保留幅度谱,并拼合为去除了内容影响的语音二重谱;步骤五、设定第二频率f2的对应离散频率编号阈值为lf2,其对应的分割阈值频率为:设定第一频率f1归一化后的第一阈值频率tf11和第二阈值频率tf12,在第一频率f1和第二频率f2构建的坐标系中划分如下4个区域,其中:区域1:区域2:区域3:区域4:l为第二频率f2离散后的序号,根据划分好的4个区域,分别计算各区域内语音二重谱的均值和标准差作为语音情感识别特征,将计算得出的8个特征输入情感语音识别模型模块中训练学习,得到语音中的情感信息。2.如权利要求1所述的高情感区分度的语音特征提取方法,其特征在于,所述步骤一中,语谱图的提取过程包括以下步骤:步骤A、设置截止频率为fb,对采集的语音信号进行低通滤波,滤波后的语音信号记为S(t),随后以采样频率fs数字化语音信号,数字化后的语音信号记为Sd(n)=S(n/fs);步骤B、设置帧长为Lf,帧移为Shf,对数字化后的语音信号进行短时帧切分,则第i帧信号为记帧长点数为步骤C、对短时帧信号进行加汉明窗处理,计算加窗后的第i帧信号Fkw:其中,α为汉明窗型调整参数;步骤D、定义频域变量为第一频率f1,设定第一频率f1的频率分辨率,得出第一级傅立叶2CN107564543A权利要求书2/3页变换的点数为N1,计算第i帧频谱的幅度:对第i帧频谱的幅度Speci(k)进行256级量化,作为灰度值,量化后的灰度值表达为:步骤E、由各帧频谱所得的灰度值拼接为语谱图STG(i,k):STG(i,k)=SpecQi(k)其中,k的取值范围限定为k=0~round(4000×N1/fs)。3.如权利要求2所述的高情感区分度的语音特征提取方法,其特征在于,所述步骤二中,对语谱图STG(i,k)进行稀疏化处理的过程包括以下步骤:步骤F、设置截止频率fc或阶次,采用低通滤波器对语谱图STG(i,k)按列取出的数据STG(i)进行平滑处理,并对低通滤波造成的偏移进行补偿,平滑和补偿后的语谱图记为STGL(i,k);步骤G、对语谱图STGL(i,k)进行第一频率f1方向的一阶差分运算,计算过程为:DSTG(i,k)=STGL(i,k+1)-STGL(i,k);步骤H、对差分结果仅保留符号,计算公式为:步骤I、随后在第一频率f1方向进行第二次一阶差分运算,计算过程为:DSDSTG(i,k)=SDSTG(i,k+1)-SDSTG(i,k);步骤J、提取第二次差分运算结果取值为-2的位置即为