预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据挖掘在商业领域的运用1数据挖掘的过程数据挖掘的过程可以理解为以下几个步骤。第一步数据清理解决数据的不一致问题、平滑噪声、补充缺失数据、识别并删除离群点。第二步数据集成把来自多个文件、数据立方或者数据库中的数据组合在一起。第三步数据选择、分析、提取数据库中与任务相关的数据。第四步数据变换通过数据平滑、汇总、聚集、泛化、规范化、属性构造等操作提高对高维数据的理解把数据变换统一成适合进行数据挖掘的形式。第五步数据挖掘选择合适的数据挖掘算法智能的提取出有用的信息或模式。数据挖掘在于发现有价值的模式总体来说数据挖掘的目的可以分为两类:描述性和预测性。描述性挖掘任务用于表示目标数据中数据的一般性质包括分类、聚类、关联分析、异常检测等预测性任务在汇总后的数据上进行归纳作出预测包括回归、分类等。第六步模式评估根据某种度量确定出某些有趣的模式或由专家来评定其价值和正确性。第七步知识表示使用可视化等信息表示方法向用户展示挖掘出的有用信息和结果分析。以上的步骤是进行数据挖掘的一般过程对于不同的应用分析过程也不尽相同在商业领域中面对来自商业的各种不同的分析任务首先应该理解该应用领域对数据分析的背景有一个很好的理解然后尽可能的按照所需信息进行信息的收集工作。2数据挖掘在商业领域中的重要应用及分析零售业是非常适合的数据挖掘的商业领域之一因为它包含了大量的销售记录、顾客购买记录、货物运输记录等大量的原始信息为数据挖掘提供了丰富的资源。分类和预测技术在市场分析、供应和销售方面为商务智能提供预测分析;聚类可以在客户关系管理方面根据顾客的相似性把顾客进行分组以便进行更多的后续分析。数据挖掘在商业上的应用具体在以下几个方面:第一帮助设计和构造数据仓库由于商业领域中信息范围太大数据库的设计也存在许多方式我们可以使用数据挖掘演练结果指导数据库的设计方便以后的使用和后续分析处理。第二对顾客需求、产品销售、趋势等构造复杂的数据立方体提供多维分析和可视化工具。第三根据顾客购买记录使用序列模式挖掘顾客的消费变化分析顾客的忠诚程度。第四产品推荐和商品的交叉推荐通过销售记录挖掘关联信息这类信息可以形成产品推荐也可以根据其他顾客的购买意愿产生个性化购买服务。第五通过多维分析、聚类分析和林群点分析可以识别可能的欺骗者和他们的习惯模式检测通过欺骗进入或未经授权访问个人或组织的账户企图发现可能需要特别注意的不寻常模式。使用数据挖掘技术可以更好的理解每组顾客的行为特征开发制定销售计划。3数据挖掘的典型分析方法3.1特征化和区分数据特征化就是简洁的汇总目标数据的一般特征。在商业活动中公司为保证自己的正常运营和经济效益要保证有一定的客户源。包括不断发展新客户对已有客户的消费行为和基础信息作为基础综合考虑客户的行为特征对可能的客户源加强推荐工作。3.2频繁模式和关联规则挖掘频繁模式能找出大部分人的喜好找出适用范围更广的有趣模式的关联性和相关性。关联规则若能同时满足最小支持度阈值和最小置信度阈值进一步发现关联的属性-值对之间的有趣的统计相关。关联规则最早是用于解决购物篮分析问题从购物篮数据中发现顾客的购买规律决定商品的摆放位置。还用于医疗中发现某些症状与某些疾病之间的关联为诊断提供更多依据。3.3分类与回归分类可以找出描述和区分数据类的模型以便接下来实现模型预测类标号以及预测位置类别的数据元素。决策树、神经网络是比较常见的用于分类的方法。相关分析是在分类和回归之前进行识别出显著相关的属性其他不想管的属性可以暂时不考虑。分类方法用于金融市场营销、市场预测、信用评估、医疗诊断等方面。分类器还可用于预测某些产品的销售情况、广告的投放区域以及保险业中评估客户的信用等级。3.4聚类(cluster)与分类不同的是分类需要一个类别属性而聚类不需要它是将数据集划分为由若干相似实例组成簇的过程使得在同一个簇中数据相似程度最大化簇间数据相异程度最高。是一种无监督的机器学习方法。涉及到的主要算法有K-meansEM算法和DBSCAN算法。聚类分析可以详细的划分市场比如基于客户特征把客户群进行划分房地产行业中对住宅户型、地理位置等特征来鉴定一个城市的房产分组。3.5离群点分析前面讨论的聚类、分类、关联分析等方法的重点在于发现大多数数据所适用的常规模式。数据集中的数据中可能包含一些与其他数据一般行为不一致的点这些数据就称为离群点大部分的离群点在一些有趣模式的挖掘过程中被丢弃然而在一些其他方面可以直接将离群点单独拿出来做分析。比如应用于灾害气象预报、欺诈检测、药物异常反应、网络安全入侵检测等领域。4数据挖掘的分析软件和展示工具无论是