预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115757911A(43)申请公布日2023.03.07(21)申请号202211582597.6(22)申请日2022.12.08(71)申请人中国农业银行股份有限公司地址100005北京市东城区建国门内大街69号(72)发明人袁自勇(74)专利代理机构北京品源专利代理有限公司11332专利代理师郭德霞(51)Int.Cl.G06F16/906(2019.01)G06F40/295(2020.01)G06F40/30(2020.01)权利要求书2页说明书11页附图4页(54)发明名称评论信息分类方法、装置、电子设备及存储介质(57)摘要本发明公开一种评论信息分类方法、装置、电子设备及存储介质,方法包括:获取样本评论信息的文本向量表征;挖掘文本向量表征的实体和主题,并根据实体、主题和文本向量表征构建异构信息图;对异构信息图进行卷积运算,得到样本评论信息的文本节点表征;利用文本节点表征进行模型训练,得到评论信息分类模型;利用评论信息分类模型对目标评论信息进行分类。即本发明可以将样本向量化后,根据从样本中挖掘的实体和主题构建异构信息图,从多个维度实现了对样本进行语义增强,解决了特征稀疏、高噪声的问题,基于对异构信息图的卷积运算获取模型训练所需的特征,利用这些特征训练得到用于对评论信息进行分类的模型,可以提高分类结果的准确度。CN115757911ACN115757911A权利要求书1/2页1.一种评论信息分类方法,其特征在于,包括:获取样本评论信息的文本向量表征;挖掘所述文本向量表征的实体和主题,并根据所述实体、所述主题和所述文本向量表征构建异构信息图;对所述异构信息图进行卷积运算,得到所述样本评论信息的文本节点表征;利用所述文本节点表征进行模型训练,得到评论信息分类模型;利用所述评论信息分类模型对目标评论信息分类。2.根据权利要求1所述的方法,其特征在于,所述样本评论信息包括有标记样本评论信息和无标记样本评论信息,所述获取样本评论信息的文本向量表征,包括:对所述有标记样本评论信息进行数据增强,得到第一样本评论信息;对所述第一样本评论信息和所述无标记样本评论信息进行语义增强,得到第二样本评论信息;将所述第二样本评论信息向量化,得到所述文本向量表征。3.根据权利要求2所述的方法,其特征在于,所述对所述有标记样本评论信息进行数据增强,得到第一样本评论信息,包括:确定所述有标记样本评论信息中的关键词和非关键词;采用随机插入操作对所述关键词进行数据增强,采用随机替换和/或随机删除操作对所述非关键词进行数据增强,得到所述第一样本评论信息。4.根据权利要求2所述的方法,其特征在于,所述对所述第一样本评论信息和所述无标记样本评论信息进行语义增强,得到第二样本评论信息,包括:采用语言理解模型的多层的特征提取器对所述第一样本评论信息和所述无标记样本评论信息进行特征提取,得到多层特征;对所述多层特征进行融合,得到所述第二样本评论信息。5.根据权利要求1所述的方法,其特征在于,所述根据所述实体、所述主题和所述文本向量表征构建异构信息图,包括:根据所述文本向量表征包含的实体构建第一类边,所述第一类边为文本到实体的边;根据所述文本向量表征包含的主题构建第二类边,所述第二类边为文本到主题的边;根据各个实体之间的相似度构建第三类边,所述第三类边为实体到实体的边;将所述文本向量表征、所述实体和所述主题作为节点,将所述第一类边、所述第二类边和所述第三类边作为边,构建所述异构信息图。6.根据权利要求5所述的方法,其特征在于,所述对所述异构信息图进行卷积运算,得到所述样本评论信息的文本节点表征,包括:对所述异构信息图随机去边,得到目标异构图;对所述目标异构图进行卷积运算,得到所述样本评论信息的文本节点表征。7.根据权利要求6所述的方法,其特征在于,所述对所述目标异构图进行卷积运算,得到所述样本评论信息的文本节点表征,包括:根据所述目标异构图中各节点的词嵌入和类型计算类型级别注意力系数;根据所述类型级别注意力系数、所述目标异构图中各节点的词嵌入和类型计算节点级别注意力系数;2CN115757911A权利要求书2/2页根据所述节点级别注意力系数确定注意力权重矩阵;根据所述注意力权重矩阵对所述目标异构图进行卷积运算,得到所述样本评论信息的文本节点表征。8.一种评论信息分类装置,其特征在于,包括:向量获取模块,用于获取样本评论信息的文本向量表征;异构图构建模块,用于挖掘所述文本向量表征的实体和主题,并根据所述实体、所述主题和所述文本向量表征构建异构信息图;卷积运算模块,用于对所述异构信息图进行卷积运算,得到所述样本评论信息的文本节点表征;模型训练模块,用于利用所述文本节点表征进行模型训练,得到评论信息分类模型;