一种基于非贪婪策略的网络蜘蛛搜索-豆柴文库

一种基于非贪婪策略的网络蜘蛛搜索.pdf

2024-07-22

10金币

106KB

5页

qw****27

实名认证

内容提供者

1/5

2/5

3/5

4/5

5/5

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

第23卷第2期计算技术与自动化Vol123,No12 2004年6月ComputingTechnologyandAutomationJun12004 文章编号:1003-6199(2004)02-0035-05 一种基于非贪婪策略的网络蜘蛛搜索算法李学勇1,田立军1,谭义红1,欧阳柳波2,李国徽3 (1.长沙大学数学与信息科学系,湖南长沙410003;2.湖南大学软件学院,湖南长沙410082; 3.华中科技大学计算机科学与技术学院,武汉430074) 摘要:在分析传统网络蜘蛛搜索策略缺点的基础上,提出了一种非贪婪的链接选择策略,进而提出了一种基于非贪婪策略的启发式搜索算法。针对国外四所著名大学计算机系网站中计算机论文资源的搜索实验表明,新算法可以有效提高搜索效率。关键词:专业搜索引擎;网络蜘蛛;搜索策略;非贪婪策略中图分类号:TP18;TP391文献标识码:A AWebSpider’sSearchingAlgorithmBasedonNon-GreedyPolicy LIXue2Yong1,TIANLi2Jun1,TANYi2Hong1,OUYANGLiu2Bo2,LIGuo2Hui3 (1.DepartmentofMathmaticsandInformationScience,ChangshaUniversity,Changsha410003,China; 2.SoftwareSchool,HunanUniversity,Changsha410082,China; 3.CollegeofComputerScienceandTechnology,HuazhongUniversityofScienceandTechnology,Wuhan430074,China) Abstract:BasedontheanalysesofthedeficienciesofthetraditionalWebspider’ssearchingstrategies, thispaperproposesanon-Greedylink-selectionpolicy.Thenaheuristicsearchingalgorithmbasedonnon- Greedypolicyisproposed.Wevalidateournewalgorithmbyexperimentsofsearchingcomputer-relevantpa2 persontheWebsitesoffourfamouscomputerdepartments.Theresultsshowthatthenewalgorithmhasbet2 terperformance. Keywords:topic-specificsearchengine;Webspider;searchingstrategy;non-Greedypolicy 图的遍历搜索策略(如广度或深度优先算法)已不 1引言再适用。以何种策略访问Web,成为近年来专业搜索引擎网络蜘蛛研究的主要问题之一[3-11]。近年来,随着WWW技术的广泛应用和人们针对这一问题,国内外的学者做了许多有益的对个性化信息检索服务需要的日益增长,传统的通研究工作。目前的专业搜索引擎主要采用基于领用搜索引擎,如Google、Fast、AltaVista和GoTo等域知识分析的“启发式”搜索策略,即先通过在线获正面临巨大的挑战[1-3]。面对这一挑战,各类适应得的领域知识评价待访问链接的价值,借以推断信特定人群需要的“专业搜索引擎”(Topic-Specific息资源的分布情况,然后按最好优先原则选择价值 SearchEngine)应运而生并引起研究者的重视[1,3]。最大的链接进行下一步的搜索。按照所采用的领由于专业搜索引擎搜索的内容只限于特定主题或域知识和评价链接价值方法的不同,现有的搜索策专门领域,因而被通用搜索引擎所广泛采用的基于略主要分为两大类:基于内容相似度评价的搜索策收稿日期:2003-12-10 基金项目:国家自然科学基金(60203017)和国家科技基础性研究专项资金项目(2001DEA20016-02-04)资助。作者简介:李学勇(1972—),男,湖南邵东人,博士研究生,讲师,研究方向:计算机网络,智能搜索引擎。 ©1995-2005TsinghuaTongfangOpticalDiscCo.,Ltd.Allrightsreserved. 63计算技术与自动化2004年6月略和基于Web结构评价的搜索策略。前者的主要计算器按照某种评价方法(如链接文本与预先定义特点是利用页面中的文本信息作为领域知识指导的主题集的相似度)计算出每个链接的价值;暂时搜索,并根据页面

相关资料

一种基于非贪婪策略的网络蜘蛛搜索.pdf

2024-07-22

106KB

一种基于非贪婪策略的网络蜘蛛搜索算法.pdf

2024-07-22

216KB

基于动力粒子群算法的网络蜘蛛搜索策略研究.docx

基于动力粒子群算法的网络蜘蛛搜索策略研究随着互联网的不断发展，大量的信息被上传到了网络中，数据量日益增大，因此人们需要一种高效的方法来访问和获取这些信息。网络蜘蛛搜索引擎因此应运而生。在这些搜索引擎中，网络蜘蛛将通过遍历互联网的页面来获取所需的信息。网络蜘蛛搜索策略旨在提高网络蜘蛛的搜索效率和精度，在这方面动力粒子群算法可以发挥重要作用。动力粒子群算法（DynamicParticleSwarmOptimization,DPSO）是一种启发式算法，它基于群集智能理论和社会学原理，通过模拟群集在解空间中的搜寻

2024-11-14

11KB

基于专业搜索引擎网络蜘蛛搜索策略研究的开题报告.docx

基于专业搜索引擎网络蜘蛛搜索策略研究的开题报告一、研究背景及意义随着互联网的日益发展，网络信息已经成为了人们获取信息的主要手段之一。网络信息的广泛应用，导致网络中存在大量的信息资源，搜索引擎的出现极大地方便了人们寻找信息的过程。在搜索引擎中，网络蜘蛛扮演着极其重要的角色，负责对网站进行爬行和索引。对于搜索引擎公司而言，网络蜘蛛的搜索策略设计将直接影响搜索结果的质量和搜索引擎的用户体验。因此，对网络蜘蛛的搜索策略进行研究，对搜索引擎的发展具有重要意义。二、研究内容和目标本研究将基于专业搜索引擎，对网络蜘蛛的

2024-09-14

10KB

基于动力粒子群算法的网络蜘蛛搜索策略研究的中期报告.docx

基于动力粒子群算法的网络蜘蛛搜索策略研究的中期报告本研究旨在探究基于动力粒子群算法的网络蜘蛛搜索策略，以提高搜索引擎的搜索效率和结果准确性。目前已完成的工作包括：1.研究网络蜘蛛的工作原理和搜索技术，了解其结构、特点和优化方法。2.探究基于粒子群算法的优化方法，包括其基本算法流程、性能指标和适用范围。3.设计基于动力粒子群算法的网络蜘蛛搜索策略，并进行了初步实验。初步实验结果表明，基于动力粒子群算法的网络蜘蛛搜索策略相对于传统的随机抽样和基于规则的搜索策略，具有更高的搜索效率和更准确的搜索结果。特别是在处

2024-09-15

10KB