预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共29页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

苏州大学本科生毕业设计(论文)2本科毕业设计(论文)学院(部)计算机科学与技术学院题目基于知识图谱的文献推荐算法研究年级2014级专业物联网工程班级14物联网学号1427407029姓名金高铭指导老师刘安职称副教授论文提交日期2018年5月19日苏州大学本科生毕业设计(论文)2目录前言5第一章绪论61.1研究背景61.2论文的内容及意义71.3本文的组织结构9第二章技术综述102.1PageRank102.2MapReduce102.3Wordembedding112.3.1单一编码词向量112.3.2分布式词向量112.3.3本文对词向量技术的使用122.4数据集及存储122.5倒排索引13第三章基于知识图谱的文献推荐算法143.1主流相关算法介绍143.2算法概要15第四章实验与统计214.1数据集与实验方法214.1评估流程214.2实验结果214.3开发环境及使用工具23第五章总结与展望255.1总结255.2未来的展望25参考文献27致谢283摘要科研工作者在进行论文写作的过程中有一个环节无法避免,即参考文献的查找与引用。而随着计算机与网络技术的发展,当前的主流方法已经从纸质文献的低效查询转变为通过网络向文献索引机构通过关键词的方式进行在线查询。因此,本文提出了一种基于知识图谱的混合型文献推荐算法,减少用户查询相关文献时需要的操作次数,向用户返回更加有效优质的文献查询结果。本文提出的算法的优势在于:(1)利用了知识图谱来挖掘更多文献之间隐含的信息,如文献的相对重要性,文献作者对文献的影响等;(2)利用词向量来衡量论文之间的内容相关性,作为论文推荐的考虑因素之一;(3)考虑了论文与引文的发表时间之间的关系,避免大量推荐过时但被大量引用的论文;(4)利用神经网络训练了一个混合式的推荐模型,来综合各类参考因素。本文在DBLP文献数据集上进行了实验,最终在2000大小的测试集上得到的准确率为8.6%,召回率为80%,F1值为15.5%,而相对比的随机采样推荐命中率为0.9%,本算法提升效果显著。关键词:知识图谱;推荐算法;引用网络;文献推荐4AbstractThereisaninevitableparttoscientificresearchworkersintheprocessofwritingthepaper,whichisthefindingandcitationofthereferences.Andwiththedevelopmentofcomputerandnetworktechnology,thecurrentmainstreammethodsarechangingfrominefficientqueryofapaperdocumentintothenetworkofdocumentindexingmechanismthroughonlinequerykeywords.Therefore,thispaperproposesahybridliteraturerecommendationalgorithmbasedonknowledgegraph,decreasingthenumberofoperationsfortheneedwhenusersqueryliteratureandreturningtotheuserqueryresultsmoreeffectivequalityliterature.Theadvantagesofthealgorithmproposedinthispaperare:(1)Usingtheknowledgemaptoexcavatethehiddeninformationbetweenthedocuments,suchastherelativeimportanceoftheliterature,theinfluenceoftheauthorontheliterature,etc.;(2)Usingthewordvectortomeasurethecorrelationbetweenthecontentsofthepaper,asoneofthefactorstobeconsideredintherecommendationofthepaper;(3)Consideringthepublish-timerelationshipbetweenpapersandcitationstoavoidalotofrecommend-outdatedbutmuchlyreferencedpapers;(4)Usingtheneuralnetworktrainingmodel,ahybridrecommendationtocomprehensiveallkindsoffactors.IntheDBLPd