预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113672693A(43)申请公布日2021.11.19(21)申请号202110970089.4(22)申请日2021.08.23(71)申请人东北林业大学地址150040黑龙江省哈尔滨市香坊区和兴路26号(72)发明人李洋王乐田(74)专利代理机构哈尔滨市松花江专利商标事务所23109代理人张换男(51)Int.Cl.G06F16/31(2019.01)G06F16/33(2019.01)G06F16/35(2019.01)G06F16/36(2019.01)G06N3/04(2006.01)权利要求书2页说明书5页附图1页(54)发明名称基于知识图谱和标签关联的在线问答平台的标签推荐方法(57)摘要基于知识图谱和标签关联的在线问答平台的标签推荐方法,涉及人工智能、自然语言处理、推荐系统技术领域。本发明是为了解决目前的标签推荐方法并不适用于问答平台的场景从而导致推荐效果差的问题。本发明具体过程为:将在线问答平台的问题文本和外部知识图谱输入到训练好的KOCIN模型中获得推荐的标签;KOCIN模型包括:知识集成层、序列编码层、关联捕获层;知识集成层用于从问题文本qi和外部知识图谱中提取知识三元组,将知识三元组合集成到问题文本qi中,生成Qtree;序列编码层用于将Qtree转化为Qtree的稠密向量化表示进而获得预测的问题文本原始标签;关联捕获层用于根据预测的问题文本原始标签获得问题文本的推荐标签。本发明用于获取问答平台的推荐标签。CN113672693ACN113672693A权利要求书1/2页1.基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于所述方法具体过程为:将在线问答平台的问题文本和外部知识图谱输入到训练好的KOCIN模型中获得推荐的标签;所述KOCIN模型包括:知识集成层、序列编码层、关联捕获层;所述知识集成层用于从问题文本qi和外部知识图谱中提取知识三元组,然后将知识三元组集成到问题文本qi中,生成句子树Qtree;所述序列编码层采用基于BERT的序列编码器,用于将Qtree转化为Qtree的稠密向量化表示进而获得预测的问题文本原始标签;所述关联捕获层包括:多个标签关联网络CorNet,用于根据预测的问题文本原始标签获得问题文本的推荐标签。2.根据权利要求1所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述知识集成层用于从问题文本和外部知识图谱中提取知识三元组,然后将知识三元组集成到问题文本中,生成句子树Qtree,包括以下步骤:步骤一一、对于问题文本qi中的每个实体ej进行知识查询,从而提取知识三元组的集合E;步骤一二、将知识三元组的集合E中的所有知识三元组插入到问题文本qi中,生成句子树Qtree。3.根据权利要求2所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述步骤一一中对于问题文本qi中的每个实体ej进行知识查询,从而提取知识三元组的集合E,如下式:其中,E={(ej,rj1,ej1),...,(ej,rjk,ejk)}是与ej匹配的知识三元组的集合,rj1是实体ej与匹配到的第一个知识三元组的关系,ej1是实体ej匹配到的第一个知识三元组的实体,(ej,rjk,ejk)是第k个知识三元组,K_Query()是查询函数。4.根据权利要求3所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述步骤一二中将知识三元组的集合E中的所有知识三元组插入到问题文本qi中,生成句子树Qtree,如下式:Qtree=K_Insert(ej,E)={w1,w2,...ej{(rj1,ej1),...,(rjk,ejk)},...,wn}其中,Qtree={w1,w2,...ej{(rj1,ej1),...,(rjk,ejk)},...,wn},wi是构成句子的词,i∈[1,n],K_Insert()是插入函数,n是构成句子的词的总数量。5.根据权利要求4所述的基于知识图谱和标签关联的在线问答平台的标签推荐方法,其特征在于:所述序列编码层采用基于BERT的序列编码器,用于将Qtree转化为Qtree的稠密向量化表示进而获得预测的问题文本原始标签,包括以下步骤:步骤二一、将步骤一二获得的Qtree的开头插入多个[CLS]标记,获得插入[CLS]标记后的句子树:Qtree_CLS={[CLS1],...,[CLSc],w1,w2,...ej{(rj1,ej1),...,(rjk,ejk)},...,wn}其中,c是插入的[CLS]标记总数;步骤二二、序列编码器利用Qtree_CLS获得[CLS]标记的隐藏状态向量,再根据[CLS]标2CN113672693A权利要求书