预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN102236646A*(12)发明专利申请(10)申请公布号CN102236646A(43)申请公布日2011.11.09(21)申请号201010150965.0(22)申请日2010.04.20(71)申请人得利在线信息技术(北京)有限公司地址100083北京市清华东路东王庄小区5-1002室(72)发明人倪毅张惟师(51)Int.Cl.G06F17/30(2006.01)权利要求书1页说明书4页附图3页(54)发明名称对象级垂直搜索引擎个性化排序算法iRank(57)摘要对象级垂直搜索引擎个性化排序算法iRank本发明公开一种对象级垂直搜索引擎的个性化推荐算法iRank,该算法其基本思想是:对垂直领域对象级搜索引擎排序算法和用户行为进行深入细致的研究,通过收集垂直领域的信息构建行业本体库模型,运用数据挖掘领域情感分析和Eyetrack技术(互联网用户在当前页面的停留时间)收集用户行为信息,统计并构建用户趣模型和相似用户模型,最后将基于用户兴趣模型和相似用户模型的个性化推荐算法结合到搜索引擎的排序中。iRank算法可以智能地对对象级搜索引擎语义信息检索结果进行个性化的排序,影响返回对象的排序得分,实现对象集结果上的不同用户间的个性化排序。与传统搜索引擎的排序算法(PageRank,HITS)相比增加搜索引擎对用户兴趣的应变能力,有极大实际应用价值。CN102364ACCNN110223664602236650A权利要求书1/1页1.对象级垂直搜索引擎个性化排序算法iRank包括:行业本体库模型:用于构建本行业对象级信息库,包括每个对象的基本结构化信息和对象之间的相似度信息。语义分析模型:用于对输入关键词进行语义级搜索匹配,包括切词、同义词、查找匹配和相关度排序模型等子模型。用户兴趣模型:用于构建用户和本体库对象之间喜好兴趣关系,并对语义模型排序结进行基于用户兴趣模型的个性化推荐排序,包括情感分析器和eyetrack分析器。相似用户模型:用于构建结构化用户之间的相似度信息,并对用户兴趣模型排序结果再进行基于用户相似度模型的个性化推荐排序,包括user-item矩阵和协同过滤个性化推荐器。2.根据权利要求1所述的算法,其特征是该行业本体库模型通过正则表达式和字符串匹配算法从抓取网页中抽取以上信息,构建item餐馆对象。3.根据权利要求2所述的算法,其特征是该行业本体库模型通过向量相似度计算法方法构建item-item的相似矩阵。4.根据权利要求3所述的算法,其特征是该语义分析模型通过使用stanford-postagger和ictclas工具对输入的Query进行切词。5.根据权利要求4所述的算法,其特征是该查找匹配模型对切词集合和同义词集合在本体库对象的各个域(名称、地址和简介等)上进行关键字匹配。6.根据权利要求5所述的算法,其特征是该相关度排序模型通过匹配程度和词频等信息进行对匹配结果进行排序并返回给用户。7.根据权利要求6所述的算法,其特征是该用户兴趣模型中的情感分析器通过使用Text-MinerSoftwareKit(TMSK)和RuleInductionKitforText(RIKTEXT)工具来自动得到用户对餐馆整体和各个feature的喜好评价结果。8.根据权利要求7所述的算法,其特征是该用户兴趣模型通过eyetrack技术(互联网用户在当前页面的停留时间)来计算没有发表评论的user对item的喜好评价结果。9.根据权利要求8所述的算法,其特征是该相似用户模型的协同过滤器通过user-based的推荐方法进行个性化推荐。10.根据权利要求9所述的算法,其特征是iRank算法采用语义分析模型、用户兴趣模型和相似用户模型三层架构方式,对每个模型的排序结果进行递进式个性化推荐排序。2CCNN110223664602236650A说明书1/4页对象级垂直搜索引擎个性化排序算法iRank技术领域[0001]本发明涉及对象级垂直搜索引擎领域中个性化搜索结果相关性排序的算法研究。背景技术[0002]时代的发展,使得互联网网页规模以人类难以想象的速度爆炸性膨胀,信息过剩、注意力稀缺的主要矛盾进一步深化。传统通用搜索的问题也越来越突出和深化,主要问题是:无效信息过多(噪音数据多)、有效信息不足、有效信息非结构化、返回结果无个性化优化机制。下一代搜索引擎的发展趋势是更加智能,其中最重要的分支是对象级垂直搜索。在所垂直的领域,该技术能够为用户提供比通用搜索更多的领域内相关有效信息。在所垂直的领域内,该技术为用户提供的都是经过整理的、结构化的对象信息,从而大大降低无效信息的比例。[0003]个性化搜索引擎排序是指在普通搜索引擎相关性排序基础上,根据用户的背景,使用记录和兴趣等调整排序算法,针