预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共91页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

搜索引擎初探--以Google为例提纲一、搜索引擎基础知识介绍 前言前言前言发展史分类分类分类分类分类二、搜索引擎构成及工作流程 主要组成主要组成主要组成主要组成主要组成三段式工作流程系统工作流程三、Google概述 概述查询生命周期基本工作原理技术特点四、PageRank原理及其求解 问题传统搜索引擎Google:PageRankPageRankPageRankPageRank计算公式影响PageRank的因素如何求解?网页链接示意图网页链接矩阵Google矩阵PageRank求解基本思路转移概率矩阵示例PageRank求解乘幂法示例思考一思考一思考二五、相关性:文本匹配简单度量:词频交叉熵网页与查询的关系分词六、Google内部工作流程 内部工作流程内部工作流程内部工作流程内部工作流程内部工作流程内部工作流程内部工作流程内部工作流程扩展一:网络蜘蛛(爬虫) 概述概述概述概述Google爬虫Google爬虫种类爬取策略爬取策略爬取策略爬取策略扩展二:索引分析索引分析工作索引分析工作索引分析工作检索步骤扩展三:开源工具包及项目开源搜索引擎工具包开源搜索引擎开源搜索引擎扩展四:模型中存在问题的解决问题一问题一问题一问题一问题二问题二问题二其他思考谢谢大家!