预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114201580A(43)申请公布日2022.03.18(21)申请号202111403563.1(22)申请日2021.11.24(71)申请人泰康保险集团股份有限公司地址100031北京市西城区复兴门内大街156号(72)发明人李红岩刘岩关春生李玉莹党莹(74)专利代理机构隆天知识产权代理有限公司72003代理人郑特强石海霞(51)Int.Cl.G06F16/33(2019.01)权利要求书3页说明书15页附图8页(54)发明名称数据处理方法、装置、电子设备和计算机可读存储介质(57)摘要本公开提供一种数据处理方法、装置以及电子设备和计算机可读存储介质,包括:获取第一音频,并确定发出第一音频的目标对象对应的语言类型和科室类型;根据目标对象的语言类型在多个声学模型中确定目标声学模型,并根据科室类型在多个语言模型中确定目标语言模型;根据目标声学模型对第一音频进行处理,以获取第一音频的第一音素;根据目标语言模型对第一音素进行处理,以获得第一音频对应的第一文本;在多个电子病历模板中确定与科室类型对应的目标电子病历模板,目标电子病历模板中包括多个激活词;根据多个激活词将第一文本进行结构化处理以生成第一结构化内容,以便根据目标电子病历模板和第一结构化内容为目标对象生成目标电子病历。CN114201580ACN114201580A权利要求书1/3页1.一种数据处理方法,其特征在于,包括:获取第一音频,并确定发出所述第一音频的目标对象对应的语言类型和科室类型;根据所述目标对象的语言类型在多个声学模型中确定目标声学模型,并根据所述科室类型在多个语言模型中确定目标语言模型;根据所述目标声学模型对所述第一音频进行处理,以获取所述第一音频的第一音素;根据所述目标语言模型对所述第一音素进行处理,以获得所述第一音频对应的第一文本;在多个电子病历模板中确定与所述科室类型对应的目标电子病历模板,所述目标电子病历模板中包括多个激活词;根据所述多个激活词将所述第一文本进行结构化处理以生成第一结构化内容,以便根据所述目标电子病历模板和所述第一结构化内容为所述目标对象生成目标电子病历。2.根据权利要求1所述方法,其特征在于,确定发出所述第一音频的目标对象对应的语言类型和科室类型,包括:获取医生音频聚类组,并确定所述医生音频聚类组的聚类中心;如果所述第一音频与所述聚类中心的特征距离小于第一阈值,则确定所述目标对象是医生;若所述目标对象是医生,则确定所述目标对象对应的语言类型和科室类型。3.根据权利要求2所述方法,其特征在于,获取医生音频聚类组,包括:获取多段待聚类音频;对所述多段待聚类音频进行聚类,以获得两个音频聚类组,其中所述两个音频聚类组包括第一音频聚类组;从所述第一音频聚类组中获取至少一段时长大于第一阈值的待比对音频;通过声纹识别技术将所述至少一段待比对音频与医生音频进行比对;若所述至少一段待比对音频与所述医生音频比对成功,则确定所述第一音频聚类组是所述医生音频聚类组。4.根据权利要求3所述方法,其特征在于,所述方法还包括:确定所述第一音频的时长超过第二阈值;将所述第一音频加入所述多段待聚类音频;对加入所述第一音频的待音频聚类进行重新聚类,以重新获得两个音频聚类组;根据重新获得的两个音频聚类组重新确定所述医生音频聚类组。5.根据权利要求3所述方法,其特征在于,所述医生音频聚类组包括第二音频;其中,所述方法还包括:从所述医生音频聚类组中获取所述第二音频;确定所述第二音频由所述目标对象发出;根据所述目标声学模型对所述第二音频进行处理,以获取所述第二音频的第二音素;根据所述目标语言模型对所述第二音素进行处理,以获得所述第二音频对应的第二文本;根据所述多个激活词将所述第二文本进行结构化处理,以生成第二结构化内容;根据所述第一结构化内容、所述第二结构化内容、和所述目标电子病历模板为所述目2CN114201580A权利要求书2/3页标对象生成所述目标电子病历。6.根据权利要求3所述方法,其特征在于,所述方法还包括:响应于音频采集触发操作,通过音频采集装置采集目标时长的起始音频;通过端点检测技术对所述起始音频按照端点进行拆分,以获得所述多段待聚类音频。7.根据权利要求1所述方法,其特征在于,所述多个激活词包括第一激活词和第二激活词,所述目标电子病历模板包括第一版块;其中,根据所述多个激活词将所述第一文本进行结构化处理以生成第一结构化内容,包括:确定所述第一文本包括所述第一激活词和所述第二激活词,且所述第二激活词在所述第一文本中是所述第二激活词的下一个激活词;从所述第一文本中截取所述第一激活词和所述第二激活词之间的待处理文本;对所述待处理文本进行结构化处理,以生成所述第一版块对应的结构化内容。8