预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110442676A(43)申请公布日2019.11.12(21)申请号201910588974.9(22)申请日2019.07.02(71)申请人北京邮电大学地址100876北京市海淀区西土城路10号北京邮电大学新科研楼627室(72)发明人欧中洪谭言信戴敏江史亚楠宋美娜宋俊德(74)专利代理机构北京清亦华知识产权代理事务所(普通合伙)11201代理人张润(51)Int.Cl.G06F16/33(2019.01)G06F16/332(2019.01)G06F17/27(2006.01)G06N3/04(2006.01)权利要求书2页说明书10页附图2页(54)发明名称基于多轮对话的专利检索方法及装置(57)摘要本发明公开了一种基于多轮对话的专利检索方法及装置,其中,该方法包括:获取输入方的输入语句,并对输入语句进行分词生成多个分词;对多个分词进行命名实体识别处理,得到与输入语句对应的多个实体;对多个实体进行意图检测得到与输入语句对应的意图结果;获取输入方的历史对话信息,并根据历史对话信息和意图结果更新当前状态信息;获取与更新后的当前状态信息对应的执行动作,并根据执行动作生成与输入语句对应的查询请求;将查询请求输入专利知识库,得到查询结果,将查询结果加入预设模板返回给输入方。该方法利用多轮对话的方式呈现当前检索结果,辅助用户进行专利检索需求,可规范用户的需求描述,显著提高专利检索的准确率。CN110442676ACN110442676A权利要求书1/2页1.一种基于多轮对话的专利检索方法,其特征在于,包括以下步骤:获取输入方的输入语句,并对所述输入语句进行分词生成多个分词;对所述多个分词进行命名实体识别处理,得到与所述输入语句对应的多个实体;对所述多个实体进行意图检测得到与所述输入语句对应的意图结果;获取所述输入方的历史对话信息,并根据所述历史对话信息和所述意图结果更新当前状态信息;获取与更新后的当前状态信息对应的执行动作,并根据所述执行动作生成与所述输入语句对应的查询请求;将所述查询请求输入专利知识库,得到查询结果,将所述查询结果加入预设模板返回给所述输入方。2.根据权利要求1所述的方法,其特征在于,所述对所述输入语句进行分词生成多个分词,包括:添加用户词典,将高频、误切分的专利名称和公司名称加入所述用户词典来辅助分词。3.根据权利要求1所述的方法,其特征在于,获取所述输入方的输入语句后,生成所述输入方所能产生的所有动作,在所有动作中获取与更新后的当前状态信息对应的执行动作。4.根据权利要求1所述的方法,其特征在于,采用BERT+BiLSTM+CRF的模型结构进行命名实体识别任务,BERT为预训练模型,BiLSTM是双向的LSTM模型,CRF是条件随机场模型,所述BERT+BiLSTM+CRF的模型结构分为三层,第一层是BRET预训练层,将输入语句序列表示为稠密的二维向量矩阵;第二层是双向LSTM层,自动提取输入语句特征,将一个输入语句的各个词的embedding依次输入LSTM中,再将正向LSTM输出的隐状态序列与反向LSTM的在各个位置输出的隐状态进行按位置拼接,得到完整的隐状态序列;第三层是CRF层,进行句子级的序列标注,利用维特比算法计算序列标注的最优解,得到分词标注结果。5.根据权利要求1所述的方法,其特征在于,所述查询结果包括所述输入语句对应的提示信息和专利查询结果。6.一种基于多轮对话的专利检索装置,其特征在于,包括:分词模块,用于获取输入方的输入语句,并对所述输入语句进行分词生成多个分词;实体识别模块,用于对所述多个分词进行命名实体识别处理,得到与所述输入语句对应的多个实体;意图检测模块,用于对所述多个实体进行意图检测得到与所述输入语句对应的意图结果;状态更新模块,用于获取所述输入方的历史对话信息,并根据所述历史对话信息和所述意图结果更新当前状态信息;生成模块,用于获取与更新后的当前状态信息对应的执行动作,并根据所述执行动作生成与所述输入语句对应的查询请求;输出模块,用于将所述查询请求输入专利知识库,得到查询结果,将所述查询结果加入预设模板返回给所述输入方。7.根据权利要求6所述的装置,其特征在于,所述对所述输入语句进行分词生成多个分2CN110442676A权利要求书2/2页词,包括:添加用户词典,将高频、误切分的专利名称和公司名称加入所述用户词典来辅助分词。8.根据权利要求6所述的装置,其特征在于,采用了BERT+BiLSTM+CRF的模型结构进行命名实体识别任务,BERT为预训练模型,BiLSTM是双向的LSTM模型,CRF是条件随机场模型,所述BERT+BiLSTM+CRF的模型结构分为三层,第一层是BRET预训练层,将输入