预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113887223A(43)申请公布日2022.01.04(21)申请号202111155436.4(22)申请日2021.09.29(71)申请人苏州浪潮智能科技有限公司地址215100江苏省苏州市吴中区吴中经济开发区郭巷街道官浦路1号9幢(72)发明人唐超甄鹏(74)专利代理机构北京集佳知识产权代理有限公司11227代理人韩丽波(51)Int.Cl.G06F40/289(2020.01)G06K9/62(2006.01)权利要求书2页说明书10页附图4页(54)发明名称一种字符串匹配方法和相关装置(57)摘要本申请公开了一种字符串匹配方法和相关装置,在第一轮字符匹配过程中,依据先中间后两边的原则,将待匹配字符串的中间字符与多个文本中的字符进行匹配,若查找到第一文本中包括待匹配字符串的中间字符,利用中间字符与待匹配字符串的首字符、尾字符的距离,将待匹配字符串的首字符、尾字符分别与第一文本进行匹配,筛选得到包括待匹配字符串的相似字符串的第二文本。依据先中间后两边的原则,对待匹配字符串中的剩余字符和第二文本中的相似字符串执行下一轮字符匹配,从第二文本中筛选目标文本,直到满足字符匹配结束条件为止。若目标文本中包括与待匹配字符串的字符全部匹配的目标字符串,将目标字符串作为待匹配字符串的匹配字符串。CN113887223ACN113887223A权利要求书1/2页1.一种字符串匹配方法,其特征在于,所述方法包括:获取待匹配字符串;在第一轮字符匹配过程中,依据先中间后两边的原则,将所述待匹配字符串的中间字符与多个文本中的字符进行匹配;若查找到所述多个文本中的第一文本中包括所述待匹配字符串的中间字符,利用所述中间字符与所述待匹配字符串的首字符的距离,将所述待匹配字符串的首字符与所述第一文本进行匹配,以及利用所述中间字符与所述待匹配字符串的尾字符的距离,将所述待匹配字符串的尾字符与所述第一文本进行匹配,从所述第一文本中筛选得到第二文本,所述第二文本中包括所述待匹配字符串的相似字符串;依据所述先中间后两边的原则,对所述待匹配字符串中的剩余字符和所述第二文本中的相似字符串执行下一轮字符匹配,从所述第二文本中筛选目标文本,直到满足字符匹配结束条件为止;在满足字符匹配结束条件时,若所述目标文本中包括与所述待匹配字符串的字符全部匹配的目标字符串,将所述目标字符串作为所述待匹配字符串的匹配字符串。2.根据权利要求1所述的方法,其特征在于,所述在第一轮字符匹配过程中,依据先中间后两边的原则,将所述待匹配字符串的中间字符与多个文本中的字符进行匹配之前,所述方法还包括:依据先中间后两边的原则,将所述待匹配字符串中的字符进行标识,得到所述待匹配字符串中每个字符的标识特征值,所述标识特征值用于标识每轮字符匹配所使用的目标字符在所述待匹配字符串中的位置,每轮字符匹配对应的目标字符至少包括该轮字符匹配所对应的字符串中的中间字符、首字符和尾字符中至少一种字符,该轮字符匹配所对应的字符串为所述待匹配字符串中的全部字符串或部分字符串。3.根据权利要求2所述的方法,其特征在于,所述将所述待匹配字符串的中间字符与多个文本中的字符进行匹配,包括:根据所述标识特征值在所述待匹配字符串中获取第一轮字符匹配对应的所述待匹配字符串的中间字符;将获取到的所述待匹配字符串的中间字符与多个文本中的字符进行匹配。4.根据权利要求2所述的方法,其特征在于,每轮字符匹配对应的目标字符还包括额外字符,所述额外字符是该轮字符匹配所对应的字符串中与其中间字符、首字符或尾字符相同的字符。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:将包括所述匹配字符串的目标文本确定为所述待匹配字符串的检索结果;返回所述检索结果。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:在所述检索结果中对所述匹配字符串进行标记。7.一种字符串匹配装置,其特征在于,所述装置包括:获取单元,用于获取待匹配字符串;匹配单元,用于在第一轮字符匹配过程中,依据先中间后两边的原则,将所述待匹配字符串的中间字符与多个文本中的字符进行匹配;2CN113887223A权利要求书2/2页所述匹配单元,还用于若查找到所述多个文本中的第一文本中包括所述待匹配字符串的中间字符,利用所述中间字符与所述待匹配字符串的首字符的距离,将所述待匹配字符串的首字符与所述第一文本进行匹配,以及利用所述中间字符与所述待匹配字符串的尾字符的距离,将所述待匹配字符串的尾字符与所述第一文本进行匹配,从所述第一文本中筛选得到第二文本,所述第二文本中包括所述待匹配字符串的相似字符串;所述匹配单元,还用于依据所述先中间后两边的原则,对所述待匹配字符串中的剩余字符和所述第二文本中的相似字符