预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113920986A(43)申请公布日2022.01.11(21)申请号202111149636.9G10L25/78(2013.01)(22)申请日2021.09.29G06F40/30(2020.01)G06F16/33(2019.01)(71)申请人中国平安人寿保险股份有限公司G06F16/335(2019.01)地址518033广东省深圳市福田区益田路5033号平安金融中心14、15、16、37、41、44、45、46层(72)发明人王振兴(74)专利代理机构北京市京大律师事务所11321代理人姚维(51)Int.Cl.G10L15/02(2006.01)G10L15/26(2006.01)G10L17/02(2013.01)G10L25/30(2013.01)权利要求书2页说明书13页附图7页(54)发明名称会议记录生成方法、装置、设备及存储介质(57)摘要本发明涉及人工智能领域,公开了一种会议记录生成方法、装置、设备及存储介质,用于解决现有技术中自动生成的会议记录中信息内容误差较大的技术问题。该方法包括:获取待进行记录识别的会议音频文件;调用预置的语音识别模型对会议音频文件进行语音识别,得到会议音频文件中的文本内容;调用预置的声纹提取模型对会议音频文件进行声纹特征提取,得到会议音频文件中的声纹特征,其中,声纹特征为至少一个;根据声纹特征,在预置的声纹信息库中查找声纹特征对应的参会人信息;根据参会人信息对文本内容进行发言人标注,得到发言人信息;根据参会人信息确定会议所属的工作项目,并根据工作项目、文本内容和对应的发言人信息生成会议记录。CN113920986ACN113920986A权利要求书1/2页1.一种会议记录生成方法,其特征在于,所述会议记录生成方法包括:获取待进行记录识别的会议音频文件;调用预置的语音识别模型对所述会议音频文件进行语音识别,得到所述会议音频文件中的文本内容;调用预置的声纹提取模型对所述会议音频文件进行声纹特征提取,得到所述会议音频文件中的声纹特征,其中,所述声纹特征为至少一个;根据所述声纹特征,在预置的声纹信息库中查找所述声纹特征对应的参会人信息;根据所述参会人信息对所述文本内容进行发言人标注,得到发言人信息;根据所述参会人信息确定所述会议所属的工作项目,并根据所述工作项目、文本内容和对应的发言人信息生成会议记录。2.根据权利要求1所述的会议记录生成方法,其特征在于,在所述根据所述工作项目、文本内容和对应的发言人信息生成会议记录之后,还包括:对所述会议记录内容进行文本语义识别,提取所述会议记录的核心观点和任务内容;基于所述核心观点生成会议摘要,基于所述任务内容生成待办事项;根据所述会议摘要和待办事项对所述会议记录的内容进行更新。3.根据权利要求2所述的会议记录生成方法,其特征在于,所述语音识别模型包括特征提取层,音调识别层和文本序列匹配层,所述调用预置的语音识别模型对所述会议音频文件进行语音识别,得到所述会议音频文件中的文本内容包括:调用所述特征提取层对所述会议音频文件进行频谱特征提取,得到音频特征频谱;调用所述音调识别层将所述音频特征频谱进行切分,得到多个特征频谱片,对所述多个特征频谱片进行发音声调的识别,得到拼音序列;调用所述文本序列匹配层基于所述拼音序列进行文本序列的匹配,得到会议音频文件的文本内容。4.根据权利要求3所述的会议记录生成方法,其特征在于,所述调用预置的声纹提取模型对所述会议音频文件进行声纹特征提取,得到所述会议音频文件中的声纹特征包括:将所述会议音频文件输入声纹提取模型中进行声纹特征的提取,得到所述会议音频文件中的声学频谱特征参数、词法特征参数、韵律特征参数以及口音特征参数,其中,所述声纹提取模型是预先基于径向基函数神经网络构建的;基于所述声学频谱特征参数、所述词法特征参数、所述韵律特征参数以及所述口音特征参数生成声纹参数,得到所述会议音频文件中的声纹特征。5.根据权利要求4所述的会议记录生成方法,其特征在于,所述根据所述工作项目、文本内容和对应的发言人信息生成会议记录包括:根据所述工作项目信息确定当前会议相关领域;根据所述会议相关领域查找预置的相关领域词典;根据所述相关领域词典对所述文本内容进行调整,将识别不准确的词语进行修正,得到修正文本内容;根据所述修正文本内容和对应的发言人信息生成会议记录。6.根据权利要求1‑5中任一项所述的会议记录生成方法,其特征在于,在所述获取待进行记录识别的会议音频文件之前还包括:2CN113920986A权利要求书2/2页采集员工的语音样本,对所述语音样本进行去噪处理,得到去噪语音样本;对所述去噪语音样本进行质量检测,判断所述语音质量是否满足预设的样本阈值;若