预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114969287A(43)申请公布日2022.08.30(21)申请号202210547329.4(22)申请日2022.05.19(71)申请人平安科技(深圳)有限公司地址518057广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人杜江楠贺德涛冯丽琼(74)专利代理机构深圳市力道知识产权代理事务所(普通合伙)44507专利代理师贺小旺(51)Int.Cl.G06F16/332(2019.01)G06F16/33(2019.01)G06N3/04(2006.01)权利要求书2页说明书10页附图3页(54)发明名称文档搜索方法、装置、设备及计算机可读存储介质(57)摘要本申请涉及数据查询技术领域,提供一种文档搜索方法、装置、设备及计算机可读存储介质,通过获取样本数据,样本数据包括多个样本文档和搜索信息,样本文档中包括搜索信息匹配的目标样本文档;将多个样本文档和搜索信息输入至预设文档匹配模型中,得到搜索信息匹配的预测文档;根据预测文档和搜索信息匹配的目标样本文档,调整预设文档匹配模型的模型参数至模型收敛,得到目标文档匹配模型;获取待搜索信息和多个待匹配文档,并将待搜索信息和多个待匹配文档输入至目标文档匹配模型,得到待搜索信息匹配的目标文档,提高了文档搜索的准确性和效率。本申请还涉及区块链技术领域和人工智能技术领域,样本数据和目标文档匹配模型可存储至区块链。CN114969287ACN114969287A权利要求书1/2页1.一种文档搜索方法,其特征在于,包括:获取样本数据,其中,样本数据包括多个样本文档和搜索信息,所述样本文档中包括所述搜索信息匹配的目标样本文档;将多个所述样本文档和所述搜索信息输入至预设文档匹配模型中,对多个所述样本文档进行分句和分段,得到多个语句和多个语段,并确定所述搜索信息与每个语句的匹配分数;根据搜索信息与每个语句的匹配分数,确定所述搜索信息匹配的一个或多个目标语段;根据所述搜索信息匹配的一个或多个目标语段,确定所述搜索信息匹配的预测文档;根据所述预测文档和所述搜索信息匹配的目标样本文档,调整所述预设文档匹配模型的模型参数至预设文档匹配模型收敛,得到目标文档匹配模型;获取待搜索信息和多个待匹配文档,并将所述待搜索信息和多个所述待匹配文档输入至目标文档匹配模型,得到所述待搜索信息匹配的目标文档。2.如权利要求1所述的文档搜索方法,其特征在于,所述根据搜索信息与每个语句的匹配分数,确定所述搜索信息匹配的一个或多个目标语段,包括:对所述搜索信息与每个语句的匹配分数的进行排序,得到语句队列;根据匹配分数由高到低从语句队列中依次选取预设数量个语句,得到预设数量个目标语句;确定各所述目标语句所属的各语段,得到所述搜索信息匹配的一个或多个目标语段。3.如权利要求1所述的文档搜索方法,其特征在于,所述根据所述搜索信息匹配的一个或多个目标语段,确定所述搜索信息匹配的预测文档,包括:确定所述搜索信息与每个目标语段的语段匹配分数;将所述语段匹配分数最高的目标语段对应的样本文档,确定为所述搜索信息匹配的预测文档。4.如权利要求1所述的文档搜索方法,其特征在于,所述根据所述预测文档和所述搜索信息匹配的目标样本文档,调整所述预设文档匹配模型的模型参数至预设文档匹配模型收敛,得到目标文档匹配模型,包括:根据所述预测文档和所述搜索信息匹配的目标样本文档,确定所述预设文档匹配模型是否收敛;若所述预设文档匹配模型未收敛,则调整所述预设文档匹配模型的模型参数,并继续训练更新后的预设文档匹配模型至收敛,得到所述目标文档匹配模型。5.如权利要求4所述的文档搜索方法,其特征在于,所述根据所述预测文档和所述搜索信息匹配的目标样本文档,确定所述预设文档匹配模型是否收敛,包括:根据所述预测文档和所述搜索信息匹配的目标样本文档,确定所述预设文档匹配模型的损失值;若确定所述损失值小于或等于预设阈值,则确定所述预设文档匹配模型已收敛;若确定所述损失值大于预设阈值,则确定所述预设文档匹配模型未收敛。6.如权利要求5所述的文档搜索方法,其特征在于,所述根据所述预测文档和所述搜索信息匹配的目标样本文档,确定所述预设文档匹配模型的损失值,包括:2CN114969287A权利要求书2/2页获取预设第一权重参数和第二预设权重参数;根据所述预设第一权重参数和预测文档,确定第一参数,并根据第二预设权重参数和目标样本文档,确定第二参数;对所述第一参数和第二参数进行差值运算,得到所述预设文档匹配模型的损失值。7.如权利要求6所述的文档搜索方法,其特征在于,所述根据所述预设第一权重参数和预测文档,确定第一参数,并根据第二预设权重参数和目标样本文档,确定第二参数,包括:对所述预测文档进行