预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113555004A(43)申请公布日2021.10.26(21)申请号202110801507.7(22)申请日2021.07.15(71)申请人复旦大学地址200433上海市杨浦区邯郸路220号(72)发明人赵张王守岩汪静莹刘伟(74)专利代理机构上海德昭知识产权代理有限公司31204代理人郁旦蓉(51)Int.Cl.G10L15/02(2006.01)G10L15/06(2013.01)G10L15/08(2006.01)G10L25/63(2013.01)权利要求书1页说明书8页附图2页(54)发明名称基于特征选择与迁移学习的语音抑郁状态识别方法(57)摘要本发明提供一种基于特征选择与迁移学习的语音抑郁状态识别方法,针对基于语音进行建模时特征维度较高、特征分布受被试除抑郁水平外的个体差异影响两个问题,提出融合Lasso和迁移学习方法CORAL的语音抑郁状态识别方法。其优势在于1.Lasso过滤特征中的冗余信息,保留有效特征,在提升模型效率的基础上进一步提升识别精度;2.迁移学习方法CORAL在不泄漏抑郁标签信息的前提下,拉近训练集与测试集的特征分布,减小特征分布受抑郁水平外其他因素的影响。两种方法相结合能进一步提高抑郁筛查的准确性和稳定性。CN113555004ACN113555004A权利要求书1/1页1.一种基于特征选择与迁移学习的语音抑郁状态识别方法,用于识别语音抑郁状态,其特征在于,包括:步骤S1,使用录音设备采集语音,获得语音样本;步骤S2,对所述语音样本进行预处理;步骤S3,提取所述语音样本中的语音特征,所述语音特征至少包括色度特征;步骤S4,计算所述语音特征的统计量,将所述统计量作为特征集;步骤S5,使用Lasso模型对所述特征集进行特征选择,得到有效特征集;步骤S6,基于所述有效特征集,使用CORAL方法进行迁移学习,得到迁移后的训练集特征;步骤S7,基于所述训练集特征,对所述语音样本进行分类,并输出分类结果。2.根据权利要求1所述的基于特征选择与迁移学习的语音抑郁状态识别方法,其特征在于:其中,所述语音特征还包括声学特征、频域特征、停顿特征和梅尔频率倒谱系数。3.根据权利要求1所述的基于特征选择与迁移学习的语音抑郁状态识别方法,其特征在于:其中,所述统计量包括最大值、最小值、极差、均值、中位数、线性回归的截距项、线性回归的自变量系数、线性回归的R2、标准差、偏度、峰度以及变异系数。4.根据权利要求1所述的基于特征选择与迁移学习的语音抑郁状态识别方法,其特征在于:其中,所述分类使用的分类器模型为XGBoost。5.根据权利要求1所述的基于特征选择与迁移学习的语音抑郁状态识别方法,其特征在于:其中,所述预处理包括噪音片断的移除,静音片断的移除,高通滤波以及降采样。6.一种基于特征选择与迁移学习的语音抑郁状态识别装置,其特征在于,包括:语音采集部,用于采集所述语音样本;预处理部,用于对所述语音样本进行预处理;特征提取部,用于提取所述语音样本的所述语音特征;特征处理部,用于对所述语音特征进行处理,得到所述有效特征集;迁移学习部,用于对所述有效特征集进行迁移学习,得到迁移后的所述训练集特征;分类部,用于对所述语音样本进行分类。2CN113555004A说明书1/8页基于特征选择与迁移学习的语音抑郁状态识别方法技术领域[0001]本发明属于语音信号处理领域,具体涉及一种基于特征选择与迁移学习的语音抑郁状态识别方法。背景技术[0002]抑郁症是一种在世界范围内典型且常见的精神性疾病,覆盖各个年龄阶段,现行的抑郁症临床诊断方法依赖医生的临床经验和患者填写的相关量表,整个过程耗时较长,诊断流程效率低下。语音作为情绪一种重要的外部表现,因其使用限制少、设备成本低、无接触、采集方式无创且便捷等独特的优势,成为研究人员实现自动化抑郁识别方法的重点方向。[0003]目前针对抑郁识别没有明确的有理论背景支撑的特异性特征,特征设计层面为尽可能提取语音中抑郁相关的信息,一般会使用高维度的、多个领域的特征,并比较不同特征组合的分类结果。但使用的特征数量过多,模型过于复杂,会导致识别结果的时间过长,降低诊断效率。[0004]另一方面人说话是一个非常复杂的过程,目前已经有诸多研究探索抑郁患者的大脑结构与功能和正常人之间的差异,除抑郁症外,对语音造成影响的潜在因素还有很多,主要包括:性别、年龄、情绪状态、言语方式和学历工作背景等。这些因素都会进一步拉大不同被试语音信号的特征分布差异,增加模型识别的难度。[0005]此外,在语音信号相关的机器学习中,进行训练集和测试集划分时通常会假设测试集和训练集的数据是独立同分布的,然而被试语音信号的特征分布不仅会受到抑郁水平的影