预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于聚类分析的数据挖掘方法毕业论文基于聚类分析的数据挖掘方法目录前言11相关理论21.1数据挖掘(DATAMINING)理论21.1.1概念21.1.2数据挖掘的任务21.1.3数据挖掘的应用31.1.4数据挖掘的发展现状41.2聚类(CLUSTERING)理论51.2.1概念51.2.2聚类算法的分类51.2.3分割聚类方法61.2.4聚类算法的应用61.3WEB数据挖掘理论71.3.1文本检索概念71.3.2Web数据挖掘概念81.3.3Web数据挖掘工作原理81.3.4Web挖掘分类及各自的研究现状及发展91.4ASP理论111.4.1概念111.4.2ASP服务器(IIS)121.4.3ASP程序的发布与执行131.4.4ASP的内置对象131.5数据库理论141.5.1SQL概念141.5.2MicrosoftAccess2003数据库介绍151.5.3Access数据库的安全性152需求分析172.1任务概述172.1.1研究背景172.1.2问题提出172.1.3研究现状172.1.4研究目标182.2数据需求182.2.1静态数据182.2.2动态数据192.2.3数据库描述192.2.4数据采集192.3功能需求192.4性能需求192.4.1数据精确度需求192.4.2适应性需求202.5运行需求202.5.1用户界面202.5.2运行环境213概要设计223.1总体设计223.1.1总体结构223.1.2处理流程223.1.3模块设计243.2接口设计263.2.1外部接口263.2.2内部接口264详细设计274.1系统结构274.1.1系统框架274.1.2数据流图284.2模块详细设计284.2.1人机交互模块284.2.2聚类分析模块314.2.3数据库模块334.3数据字典345编码与实现365.1人机交互模块实现365.1.1数据库连接部分365.1.2查询匹配部分375.1.3结果显示部分375.2聚类模块实现385.2.1分词部分385.2.2文本向量空间模型部分395.2.3聚类部分405.3数据库模块实现415.3.1网络蜘蛛(spider)415.3.2数据库表416性能测试与分析416.1测试实例的研究与选择416.2测试环境与测试条件416.2.1测试环境416.2.2Web服务器的安装416.3实例测试43结束语45参考文献46致谢47摘要本设计课题为基于聚类分析的数据挖掘方法,为实现这1课题,我利用ASP技术,设计了1个Web搜索引擎。通过对搜索引擎的优化,使其对检索的初始结果进行聚类分析,返回结果给用户。从而也实现了“基于聚类分析的数据挖掘方法”这1目标。搜索引擎我设计了3个模块,分别为人机交互模块、聚类模块、数据库模块3个模块。人机交互模块通过ADO对象进行数据库连接。当用户输入关键字,检索数据库的网页数据,得到初始数据结果集,聚类模块对这些结果进行聚类分析,再把聚类结果返回给用户。由于Web文本是无结构或半结构化的,进行聚类分析之前要对文本建立向量空间。建立向量空间模型,首先对文本分词,再扫描文本提取特征值,计算这些特征值的权重,依据文本相似度对文本进行聚类,聚类算法采用k-means算法。最后把结果返回给用户。数据库模块设计了两个表,1个保存网页数据,另1个表是分词时所需要用到的表,数据的获取,由开源网络蜘蛛执行。通过设计实现,基本实现了基于聚类分析的数据挖掘方法的初衷。关键词数据挖掘;聚类分析;搜索引擎;文本向量ThemethodofDataMiningBasedonClusteringAnalysisAbstractthisdesignconcentratesondataminingmethodwhichbasedonclusteringanalysis.Inordertorealizethistask,IdesignawebsearchenginewiththetechniqueofASP.Fromoptimizingthesearchengine,theearlyresultscanbeproceededclusteringanalysis.Thiscanmakethesimilarresultsinacluster.Finally,thesearchenginereturnstheseresultstotheuser.Also,fromthis,Icangivemyvoicetothe"ThemethodofDataMiningBasedonClusteringAnalysis".Thesearchenginecomposeswiththemoduleofuser,themoduleofclusteringandthemoduleofdatabase.The