基于特征选择与迁移学习的语音抑郁状态识别方法-豆柴文库

基于特征选择与迁移学习的语音抑郁状态识别方法.pdf

2023-11-07

10金币

714KB

12页

宛菡****魔王

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共12页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113555004A(43)申请公布日2021.10.26(21)申请号202110801507.7(22)申请日2021.07.15(71)申请人复旦大学地址200433上海市杨浦区邯郸路220号(72)发明人赵张王守岩汪静莹刘伟(74)专利代理机构上海德昭知识产权代理有限公司31204代理人郁旦蓉(51)Int.Cl.G10L15/02(2006.01)G10L15/06(2013.01)G10L15/08(2006.01)G10L25/63(2013.01)权利要求书1页说明书8页附图2页(54)发明名称基于特征选择与迁移学习的语音抑郁状态识别方法(57)摘要本发明提供一种基于特征选择与迁移学习的语音抑郁状态识别方法，针对基于语音进行建模时特征维度较高、特征分布受被试除抑郁水平外的个体差异影响两个问题，提出融合Lasso和迁移学习方法CORAL的语音抑郁状态识别方法。其优势在于1.Lasso过滤特征中的冗余信息，保留有效特征，在提升模型效率的基础上进一步提升识别精度；2.迁移学习方法CORAL在不泄漏抑郁标签信息的前提下，拉近训练集与测试集的特征分布，减小特征分布受抑郁水平外其他因素的影响。两种方法相结合能进一步提高抑郁筛查的准确性和稳定性。CN113555004ACN113555004A权利要求书1/1页1.一种基于特征选择与迁移学习的语音抑郁状态识别方法，用于识别语音抑郁状态，其特征在于，包括：步骤S1，使用录音设备采集语音，获得语音样本；步骤S2，对所述语音样本进行预处理；步骤S3，提取所述语音样本中的语音特征，所述语音特征至少包括色度特征；步骤S4，计算所述语音特征的统计量，将所述统计量作为特征集；步骤S5，使用Lasso模型对所述特征集进行特征选择，得到有效特征集；步骤S6，基于所述有效特征集，使用CORAL方法进行迁移学习，得到迁移后的训练集特征；步骤S7，基于所述训练集特征，对所述语音样本进行分类，并输出分类结果。2.根据权利要求1所述的基于特征选择与迁移学习的语音抑郁状态识别方法，其特征在于：其中，所述语音特征还包括声学特征、频域特征、停顿特征和梅尔频率倒谱系数。3.根据权利要求1所述的基于特征选择与迁移学习的语音抑郁状态识别方法，其特征在于：其中，所述统计量包括最大值、最小值、极差、均值、中位数、线性回归的截距项、线性回归的自变量系数、线性回归的R2、标准差、偏度、峰度以及变异系数。4.根据权利要求1所述的基于特征选择与迁移学习的语音抑郁状态识别方法，其特征在于：其中，所述分类使用的分类器模型为XGBoost。5.根据权利要求1所述的基于特征选择与迁移学习的语音抑郁状态识别方法，其特征在于：其中，所述预处理包括噪音片断的移除，静音片断的移除，高通滤波以及降采样。6.一种基于特征选择与迁移学习的语音抑郁状态识别装置，其特征在于，包括：语音采集部，用于采集所述语音样本；预处理部，用于对所述语音样本进行预处理；特征提取部，用于提取所述语音样本的所述语音特征；特征处理部，用于对所述语音特征进行处理，得到所述有效特征集；迁移学习部，用于对所述有效特征集进行迁移学习，得到迁移后的所述训练集特征；分类部，用于对所述语音样本进行分类。2CN113555004A说明书1/8页基于特征选择与迁移学习的语音抑郁状态识别方法技术领域[0001]本发明属于语音信号处理领域，具体涉及一种基于特征选择与迁移学习的语音抑郁状态识别方法。背景技术[0002]抑郁症是一种在世界范围内典型且常见的精神性疾病，覆盖各个年龄阶段，现行的抑郁症临床诊断方法依赖医生的临床经验和患者填写的相关量表，整个过程耗时较长，诊断流程效率低下。语音作为情绪一种重要的外部表现，因其使用限制少、设备成本低、无接触、采集方式无创且便捷等独特的优势，成为研究人员实现自动化抑郁识别方法的重点方向。[0003]目前针对抑郁识别没有明确的有理论背景支撑的特异性特征，特征设计层面为尽可能提取语音中抑郁相关的信息，一般会使用高维度的、多个领域的特征，并比较不同特征组合的分类结果。但使用的特征数量过多，模型过于复杂，会导致识别结果的时间过长，降低诊断效率。[0004]另一方面人说话是一个非常复杂的过程，目前已经有诸多研究探索抑郁患者的大脑结构与功能和正常人之间的差异，除抑郁症外，对语音造成影响的潜在因素还有很多，主要包括：性别、年龄、情绪状态、言语方式和学历工作背景等。这些因素都会进一步拉大不同被试语音信号的特征分布差异，增加模型识别的难度。[0005]此外，在语音信号相关的机器学习中，进行训练集和测试集划分时通常会假设测试集和训练集的数据是独立同分布的，然而被试语音信号的特征分布不仅会受到抑郁水平的影

相关资料

基于特征选择与迁移学习的语音抑郁状态识别方法.pdf

本发明提供一种基于特征选择与迁移学习的语音抑郁状态识别方法，针对基于语音进行建模时特征维度较高、特征分布受被试除抑郁水平外的个体差异影响两个问题，提出融合Lasso和迁移学习方法CORAL的语音抑郁状态识别方法。其优势在于1.Lasso过滤特征中的冗余信息，保留有效特征，在提升模型效率的基础上进一步提升识别精度；2.迁移学习方法CORAL在不泄漏抑郁标签信息的前提下，拉近训练集与测试集的特征分布，减小特征分布受抑郁水平外其他因素的影响。两种方法相结合能进一步提高抑郁筛查的准确性和稳定性。

2023-11-07

714KB

基于稀疏表示的语音情感特征学习与识别方法研究的中期报告.docx

基于稀疏表示的语音情感特征学习与识别方法研究的中期报告摘要本中期报告研究了基于稀疏表示的语音情感特征学习与识别方法。首先介绍了情感识别的研究背景和现状，然后介绍了稀疏表示的基本概念和方法。接着，提出了基于稀疏表示的情感特征学习与识别方法，包括特征提取、码本学习和分类器训练等环节。最后，以IEMOCAP数据库为例，进行了实验评估，结果表明所提出的方法在情感识别任务中具有较好的性能。AbstractThismidtermreportstudiesthemethodoflearningandrecognizin

2024-09-14

11KB

基于语音和面部特征的多模态融合抑郁识别研究.docx

本文档只有word版，所有PDF版本都为盗版，侵权必究基于语音和面部特征的多模态融合抑郁识别研究目录一、内容综述................................................21.研究背景及意义........................................32.国内外研究现状........................................43.研究内容与方法........................................5

2024-09-18

29KB

一种基于迁移Softmax回归的癫痫状态识别方法.pdf

本发明提供一种基于迁移Softmax回归的癫痫状态识别方法，通过源域和目标域之间的知识迁移，使得目标域脑电信号分布向源域靠近，以此提升模型在目标域数据上的识别效果，有效提升了癫痫发作检测的可靠性，具体包括以下步骤：步骤S1，利用滑动窗口对源域原始脑电信号和目标域原始脑电信号进行分段；步骤S2，利用四层小波包分解提取滑动窗口内的小波包分解系数，并构建特征向量；步骤S3，对特征向量进行联合概率分布调整从而进行源域和目标域之间的知识迁移，同时在该知识迁移过程中完成分类器的训练；步骤S4，由分类器输出目标域原始脑

2023-07-25

591KB

基于谱特征和ELM的语音情感识别方法.pdf

本发明提供的是一种基于谱特征和ELM的语音情感识别方法。原始语音信号进行基本特征提取包括韵律特征、音质特征；利用Teager能量算子TEO算法提取梅尔频率倒谱系数MFCC和耳蜗滤波倒谱系数CFCC，二者加权得到teCMFCC特征，并与基本特征值进行融合，构建特征矩阵；用Fisher准则和相关分析对特征进行选择降维，保留语音信号的个性特征；建立极限学习机ELM决策树模型，完成语音情感识别分类。本发明强调了语音信号的非线性特征，具有很好的鲁棒性，在中国科学院自动化研究所录制的CASIA中文情感语料库上进行实验

2023-06-25

688KB