预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110991162A(43)申请公布日2020.04.10(21)申请号201911169912.0(22)申请日2019.11.25(71)申请人领猎网络科技(上海)有限公司地址200000上海市徐汇区吴中路39号新概念大厦1405-1406室(72)发明人李蒙(74)专利代理机构北京卓唐知识产权代理有限公司11541代理人唐海力(51)Int.Cl.G06F40/194(2020.01)G06F16/33(2019.01)G06F16/335(2019.01)权利要求书2页说明书8页附图3页(54)发明名称基于浏览器的自然语言处理方法及装置、设备、存储介质(57)摘要本申请公开了一种基于浏览器的自然语言处理方法及装置、设备、存储介质。该方法包括获取第一简历;其中所述第一简历通过接入第三招聘平台获取;解析所述第一简历中的简历文本,得到文本特征信息,其中所述文本特征信息中至少包括:求职者姓名、工作经历以及教育经历;根据文本特征信息在简历储备库中对比信息是否重复;如果重复,则匹配出相似的第二简历。本申请解决了基于浏览器的自然语言处理方式效果不佳的技术问题。通过本申请通过解析候选人简历中的特征信息并在公司人才储备数据库中快速精准识别出是否有相同的人选。此外本申请可作为插件在浏览器中进行使用。CN110991162ACN110991162A权利要求书1/2页1.一种基于浏览器的自然语言处理方法,其特征在于,包括:获取第一简历;其中所述第一简历通过接入第三招聘平台获取;解析所述第一简历中的简历文本,得到文本特征信息,其中所述文本特征信息中至少包括:求职者姓名、工作经历以及教育经历;根据文本特征信息在简历储备库中对比信息是否重复;如果重复,则匹配出相似的第二简历。2.根据权利要求1所述的基于浏览器的自然语言处理方法,其特征在于,根据文本特征信息在简历储备库中对比信息是否重复包括:根据姓氏、工作经历和教育经历作为文本特征信息在简历储备库中对比信息是否重复,其中所述工作经历选取第一份工作时间段的工作经历;所述教育经历选取最早教育时间段的教育经历。3.根据权利要求1所述的基于浏览器的自然语言处理方法,其特征在于,根据文本特征信息在简历储备库中对比信息是否重复包括:根据姓氏、第二工作经历和教育经历为文本特征信息在简历储备库中对比信息是否重复,其中所述第二工作经历选取第二份工作时间段的工作经历。4.根据权利要求1所述的基于浏览器的自然语言处理方法,其特征在于,根据文本特征信息在简历储备库中对比信息是否重复包括:根据姓氏、第三工作经历和教育经历为文本特征信息在简历储备库中对比信息是否重复,其中所述第三工作经历选取两个连续时间段的工作经历。5.根据权利要求1所述的基于浏览器的自然语言处理方法,其特征在于,根据文本特征信息在简历储备库中对比信息是否重复包括:根据文本特征信息在简历储备库中匹配出待选的简历文本,并对比文本相似度是否大于阈值;如果重复,则匹配出相似的第二简历包括:如果大于阈值则认为重复,并匹配出相似的第二简历。6.一种基于浏览器的自然语言处理装置,其特征在于,包括:获取模块,用于获取第一简历;其中所述第一简历通过接入第三招聘平台获取;解析模块,用于解析所述第一简历中的简历文本,得到文本特征信息,其中所述文本特征信息中至少包括:求职者姓名、工作经历以及教育经历;对比模块,用于根据文本特征信息在简历储备库中对比信息是否重复;匹配模块,用于如果重复,则匹配出相似的第二简历。7.根据权利要求6所述的基于浏览器的自然语言处理装置,其特征在于,所述对比模块,用于根据姓氏、工作经历和教育经历作为文本特征信息在简历储备库中对比信息是否重复,其中所述工作经历选取第一份工作时间段的工作经历;所述教育经历选取最早教育时间段的教育经历;根据姓氏、第二工作经历和教育经历为文本特征信息在简历储备库中对比信息是否重复,其中所述第二工作经历选取第二份工作时间段的工作经历;根据姓氏、第三工作经历和教育经历为文本特征信息在简历储备库中对比信息是否重2CN110991162A权利要求书2/2页复,其中所述第三工作经历选取两个连续时间段的工作经历。8.根据权利要求6所述的基于浏览器的自然语言处理装置,其特征在于,所述对比模块,用于根据文本特征信息在简历储备库中匹配出待选的简历文本,并对比文本相似度是否大于阈值;所述匹配模块,用于如果大于阈值则认为重复,并匹配出相似的第二简历。9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至5任一项所述的基于浏览器的自然语言处理方法的步骤。10.一种计算机可读存储介质,其上存储有计算机