预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共44页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

大律理工玄修《数据挖掘技术》课程报告数据挖掘在股票预测中的应用学院:计算机与通信工程专业:计算机技术姓名:郑春园学号:153131314不完全的、有噪声的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的,但是又是潜在有用的并且最终可理解的信息和知识的非平凡过程。事先未知的信息是指该信息是预先未预料到的,或称新颖性。新颖性要求发现的模式应该是从前未知的,该信息是预先未曾预料到的。数据挖掘就是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识。数据挖掘是一门交叉学科,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术O数据挖掘利用各种分析工具在海量数据中发现模型和数据问关系的过程,使用这些模型和关系可以进行预测,它帮助决策者寻找数据潜在的关联,发现被忽略的因素,因而被认为是解决当今时代所面临的数据爆炸而信息贫乏问题的一种有效方法。1.2数据挖掘分类数据挖掘涉及多个学科,主要包括数据库、统计学和机器学习三大主要技术。可以按照数据库类型、挖掘对象、挖掘任务、挖掘方法和技术,以及应用等几方面进行分类。按数据库类型分类数据库主要是在关系数据库中挖掘知识。随数据库类型的不断增加,逐步出现了不同数据库的数据挖掘。现有关系数据库挖掘、模糊数据挖掘、历史数据挖掘、空问数据挖掘等多种不同数据库的数据挖掘类型。按数据挖掘对象分类数据挖掘除了对数据库这个主要对象进行挖掘外,还有文本数据挖掘、多媒体数据挖掘、Web数据,这些均是非结构化数据。按数据挖掘任务分类数据挖掘的任务有关联分析、时序模式、聚类、分类,偏差检测、预测等。按任务分类有:美联规则挖掘、序列模式挖掘、聚类数据挖掘、分类数据挖掘、偏差分析挖掘和预测数据挖掘等类型。按数据挖掘方法和技术分类⑴归纳学习类:该类又分为基于信息论方法挖掘类和基于集合论方法挖掘类。基于信息论方法是在数据库中寻找信息量大的属性来建立属性的决策树。基于集合论方法是对数据库中各属性的元组集合之间关系来建立属性间的规则。各类中又包括多种方法,主要用于分类问题。仿生物技术类:该类又分为神经网络方法类和遗传算法类。神经网络方法是在模拟人脑神经元而建立的肝数学模型和Hcbb学习规则基础上,提出了〜系列的算法模型,用于识别、预测、联想、优化、聚类等实际问题。遗传算法是模拟生物遗传过程,对选择、交叉、变异过程建立了数学算子。主要用于问题的优化和规则的生成。公式发现类:在科学实验与工程数据库中,用人工智能方法寻找和发现连续属性之闻的关系,建立变量之间的公式,已引起人们的关注,该类中有多种数据挖掘方法,如BACON和FDD等。统计分析类:统计分析是门独立学科,由于能对数据库中数据求出各种不同的统计信息和知识,故也构成了数据挖掘中〜大类方法。模糊数据类:模糊数据类是反映人们思维的一种方式。将模糊数学应用于数据挖掘各项任务中,形成了模糊数据挖掘类,如模糊聚类、模糊分类、模糊关联规则等。2.1.3数据挖掘处理过程模型数据挖掘是一个需要经过反复的多次处理过程。如同软件工程在软件开发中的作用,数据挖掘的处理过程模型为数据挖掘提供了宏观指导和工程方法。合理的处理过程模型能将各个处理阶段有机地结合在一起,指导人们更好地开发及使用数据挖掘系统。从数据挖掘进入应用领域起,就有人对数据挖掘的过程进行归纳和总结,提出了不同的数据挖掘处理过程模型。其中UsalnaM.Fa}yadGergor\rPiatetsky-Shapiro等人给出的多处理阶段模型是一*种通用模型,也是最广为接受的一种处理模型。1996年,Brachman和Anand通过了解很多数据挖掘用户在实际工作中遇到的问题,发现用户的很大一部分工作量是在数据库的交互上,他们从用户的角度对数据挖掘处理过程进行了分析,认为数据挖掘应该更着重于对用户进行知识发现的整个过程的支持,而不是仅仅限于在数据挖掘的一个阶段上,进而提出了以用户为中心的处理过程模型。该模型特别注重对用户与数据库交互的支持,用户根据数据库中的数据,提出一种假设模型,然后选择有关数据进行知识的挖掘,并不断对模型的数据进行调整优化。Brachman和Anand在他们开发的数据挖掘系统IIdACS(InteractiveMarketingAnalysisAndClassificationSystem)中采用了这种以用户为中心的处理过程模型。1997年斯坦福大学的GeorgeH.John在其博士论文中给出另外一种数据挖掘处理过程模型。该模型强调由数据挖掘人员和领域专家共同参与数据挖掘的全过程。领域专家对该领域内需要解决的问题非常清楚,在问题的定义阶段由领域专家向数据挖掘人员解释,数据挖掘人员将数据挖掘所用的技术及能解决问题的种类介绍给领域专家。双方经过互相了解,对要解决的问题有一致的处理意见,包括问题的定