预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113837698A(43)申请公布日2021.12.24(21)申请号202111150063.1G06F40/216(2020.01)(22)申请日2021.09.29G06N3/08(2006.01)(71)申请人深圳云路信息科技有限责任公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)(72)发明人阚向阳姜东晓崔德冠简雄孙海林杨经海(74)专利代理机构北京市浩东律师事务所11499代理人孙莉(51)Int.Cl.G06Q10/08(2012.01)G06K9/62(2006.01)G06F40/289(2020.01)权利要求书3页说明书15页附图2页(54)发明名称一种基于相似度的地址匹配方法及装置(57)摘要本发明公开了一种基于相似度的地址匹配方法及装置,其中该方法包括:获取待匹配地址和多个历史地址向量;根据训练好的向量转换模型和转换权重表,确定所述待匹配地址对应的待匹配地址向量;基于HNSW算法,从所述多个历史地址向量中确定出与所述待匹配地址向量最相似的历史地址向量,得到目标匹配地址向量。可见,本发明能够基于训练好的向量转换模型和权重表,将待匹配的地址转换为向量后,再通过算法匹配最相似的历史地址向量,从而实现了更低成本以及更便捷的地址匹配,有利于降低算法的成本和提高算法的可拓展性,进而能够应付现有的物流网点反复变换的技术场景,达到更精确的地址匹配效果。CN113837698ACN113837698A权利要求书1/3页1.一种基于相似度的地址匹配方法,其特征在于,所述方法包括:获取待匹配地址和多个历史地址向量;根据训练好的向量转换模型和转换权重表,确定所述待匹配地址对应的待匹配地址向量;基于HNSW算法,从所述多个历史地址向量中确定出与所述待匹配地址向量最相似的历史地址向量,得到目标匹配地址向量。2.根据权利要求1所述的基于相似度的地址匹配方法,其特征在于,所述方法还包括:确定所述目标匹配地址向量对应的目标经纬度信息;根据所述目标经纬度信息,以及多个匹配网点的地理围栏信息,确定出所述目标经纬度信息对应的网点信息。3.根据权利要求1所述的基于相似度的地址匹配方法,其特征在于,所述向量转换模型为word2vec模型;和/或,所述获取待匹配地址和多个历史地址向量之前,所述方法还包括:获取多个历史训练地址;对每一所述历史训练地址进行n‑gram拆分以得到对应的拆分字段;根据所有所述拆分字段的数值指标,确定所有所述拆分字段中的召回字段;所述数值指标包括所述拆分字段的网点出现次数、逆向文件频率值标准差、频数、峰度中的至少一种;根据所述召回字段对应的逆向文件频率值标准差确定转换权重表;根据所述多个历史训练地址对向量转换模型进行训练,得到训练好的所述向量转换模型;根据所述转换权重表和所述向量转换模型,将所述多个历史训练地址转换为多个历史地址向量。4.根据权利要求3所述的基于相似度的地址匹配方法,其特征在于,所述根据所有所述拆分字段的数值指标,确定所有所述拆分字段中的召回字段,包括:计算每一所述拆分字段的逆向文件频率值标准差以及所有所述拆分字段的逆向文件频率值标准差的标准差均值;筛选出所有所述拆分字段中所述逆向文件频率值标准差低于所述标准差均值的拆分字段,以得到召回字段;和/或,计算每一所述拆分字段的最大频数;筛选出所有所述拆分字段中所述最大频数低于预设的频数阈值的拆分字段,以得到召回字段;和/或,计算每一所述拆分字段的峰度以及所有所述拆分字段的峰度的峰度均值;筛选出所有所述拆分字段中所述峰度低于所述峰度均值的拆分字段,以得到召回字段;和/或,计算每一所述拆分字段的在不同网点出现的次数;筛选出所有所述拆分字段中所述次数高于预设的次数阈值的拆分字段,以得到召回字2CN113837698A权利要求书2/3页段。5.根据权利要求3所述的基于相似度的地址匹配方法,其特征在于,所述基于HNSW算法,从所述多个历史地址向量中确定出与所述待匹配地址向量最相似的历史地址向量,得到目标匹配地址向量,包括:将所述多个历史地址向量构成HNSW向量图模型;基于K近邻算法,确定所述HNSW向量图模型中与所述待匹配地址向量最相似的前第一数量个所述历史地址向量及其对应的相似度得分;根据所述前第一数量个所述历史地址向量及其对应的相似度得分,确定目标匹配地址向量。6.根据权利要求5所述的基于相似度的地址匹配方法,其特征在于,所述根据所述前第一数量个所述历史地址向量及其对应的相似度得分,确定目标匹配地址向量,包括:判断所述前第一数量个所述历史地址向量对应的相似度得分中的最高者是否高于预设的得分阈值;若判断结果为否,将所述最高者对应的所述历