预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

电子商务消费行为论文一、粗糙集理论(一)粗糙集的下近似集和上近似集K=(US)为给定的知识库U表示论域S为U上的等价关系簇则XU和U上的一个等价关系R∈IND(K)子集X关于知识R的上近似和下近似的定义分别为。其中U为论域表示整个区域包含的元素;论域在等价关系R下的分类模式U/R表示图1中的所有方格组成的集合;R为等价关系图中为划分整个区域的横竖线。(二)知识约简知识库中的知识并不是同等重要的有些知识是冗余的。知识约简是将一些无关或多余的特征丢掉在不影响其原有的分析预测功能的前提下将信息量减少即在不影响原知识分类的情况下将n维信息空间{x1x2…xn}减小为m维{x1x2…xm}(m<n)。通过知识约简将得到的特征信息进行重新组合而产生新的决策规则利用该规则进行推理得到的结果与约简前的特征信息所产生的决策规则推理得出的结果一致(张艳荣2012)。以下为约简与核的定义它们是知识约简中两个最基本、最重要的概念。对于知识库K=(US)和K中的一个等价关系族PS任意的GP若G是独立的且IND(G)=IND(P)则称G是P的一个约简记为G∈RED(P)。其中P的全体约简组成的集合用RED(P)表示。令P为一个等价关系族PSR∈P如果IND()P=INDP-{R()}成立则称R为P中不必要的;对给定的知识库K=(US)和知识库中的一个等价关系族PS对任意的R∈P若R满足INDP-{R()}≠IND()P则称R为P中必要的。P中所有必要关系组成的集合称为P的核记作CORE(P)。(三)知识表达系统在智能数据处理中知识表达占据极其重要的地位。知识表达系统是粗糙集理论中主要的知识表示方法其基本成分是研究对象的集合。我们可以采用指定对象的基本特征和属性来进行描述表示为S=(UAVf)通常用S=(UA)来代替。其中U表示对象的非空有限集合即为论域;A表示属性的非空有限集合即为属性集;V=∪a∈AVaVa表示属性a的值域;f为U×AV是一个信息函数其为每一个对象的每个属性赋予一个信息值即a∈Ax∈Uf(xa)∈Va。这样定义的知识表达系统可以方便地用表格表达来实现。知识的表格方法可以看成一种特殊的形式语言它用符号表达等价关系这样的数据表成为知识表达系统。(四)决策表若知识表达系统S=(UAVf)其中A=C∪DC∩D=C表示条件属性集D表示决策属性集。决策表是具有条件属性和决策属性的知识表达系统如表2所示。(五)属性重要度每一个决策表中的属性在做决策和数据分类时其角色是不一样的所起到的作用也不尽相同。为了更好地计算这种属性的重要度我们可以采取的方法是逐一去掉每个属性进而检测这个决策系统在做决策和分类时是否会因为移掉了这个属性而发生明显的改变。如果去掉该属性后整个系统的决策发生了明显的改变那么这个属性就具有相当的重要性计算的重要值越大表明该属性越不可删除;反之计算的重要值越小其删除该属性的可能性越大。下面用正区域概念来表达这种思想:关于由属性集C引入的分类其属性子集B''''B的意义就是重要度的描述用这种差来表示:dB''''-B(c)=rB(c)-rB''''-B(c)该式表明如果去掉这个属性子集B''''用属性B的方法分类个体其正区域是如何被影响的。若B''''是一个属性则说明丢掉这个属性其正区域是如何被改变的。二、基于粗糙集的电子商务消费行为预测粗糙集作为一种数据处理的分析方法可在保持知识分类能力不变的情况下通过对知识进行约简得出问题的分类或决策规则(张宇、韩春怡2007)。故本文将粗糙集理论应用到电子商务顾客消费行为的预测中利用约简算法删除冗余的条件属性对电子商务消费行为的条件属性集进行约简得到必要的条件属性集;利用改进的消费行为预测的规则约简算法对电子商务消费行为预测的规则进行提取并进行约简得出电子商务顾客消费行为的决策规则。基于粗糙集理论的电子商务顾客消费行为预测具体操作过程如图2所示主要包括以下几个步骤:(1)通过对电子商务消费数据的收集、完备化及离散化完成对电子商务顾客消费行为预测基本数据的预处理;(2)去掉电子商务顾客消费行为的冗余数据信息完成对顾客消费行为预测的条件属性集的约简;(3)通过对电子商务顾客消费行为预测的规则进行提取与约简得出必要的消费行为预测规则集;(4)通过计算规则的置信度与覆盖度进行规则过滤得到电子商务消费行为预测的决策规则。(一)模型构建与算例1.粗糙集理论模型利用粗糙集理论对电子商务消费行为预测数据进行分析之前首先要对数据进行预处理收集有效数据建立电子商务消费行为预测信息表。将所有的消费行为预测数据汇总到一个信息系统里其可以用二维表来表示。信息表的行对应各对象及其各属性的值列对应各属性及各对象的属性值。