预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

万方数据 信誉评估与预测的研究动态数据挖掘技术在用户缴费E·Mail:gaoyatianl979@163.哪。李春生苗秀杰1动态数据挖掘科学技术与工程高雅田富宇前,费用拖欠问题逐渐引起了行业的注意。对于饱受欠费之苦的各个部门建立健全长效的预警机制尤为必要。数据挖掘是从存放在数据库、数据仓库程⋯。现应用数据挖掘技术,研究缴费业务中用户信誉行为模式,建立动态数据挖掘的公共服务领域用户信用评估与预测系统。在数据挖掘中,可以使用许多不同的模型,如分类模型、回归模型、时间序列模型、聚类模型和关联规则模型【2J。针对同一模型,可以使用不同的算法进行数据挖掘,算法的目的就是找到适合于数据J。这就需要调度及选择各方面的技术,使它们能够协同工作,得出最佳的挖掘配置方案,并统一管理各个挖掘步骤以及结果。传统数据挖掘系统的建立强调人工主动参与,循环测试可能有效的挖掘技术,最终得出相对可行的系统结构,导致了数据挖掘的手工化,挖掘数据处理复杂化,重复的数据探索和算法测试工作使得数据挖掘系统的建立需要较长的开发周期。现通过研究挖掘算法的动态配置机制,建立可以智能评估挖掘算法配置方案的数据挖掘模型,并且为供水部门开发用户信誉评语与预测系统。动态数据挖掘技术要求系统在用户初始信息输入后,可以自主调度可行算法路径,建立挖掘模型,并且对建模结果进行评价,最终向用户推荐最佳建模方案。数据挖掘算法的动态配置首先要求需要关心挖掘算法的运算细节,只是根据挖掘路径调度相应算法模块对训练数据集建模,系统模型如数据挖掘方案的智能配置问题需要解决两个方面的困难,即挖掘算法可行路径的推理和挖掘算法的系统调度问题。可行挖掘路径的推理与计算,即如何建立可行用盲目搜索,根据应用找出全部有意义的挖掘算法路径。因为,数据挖掘的算法需要根据不同的挖掘@2009关键词动态数据挖掘缴费业务几乎遍布了所有的公共服务领域,目或其他信息库中的大量数据中挖掘有趣知识的过的模型【3挖掘算法与系统调度控制分离,挖掘控制中心并不图1所示。1.1挖掘算法路径推理的数据挖掘方案集合。根据挖掘算法配置需要,采目的、数据特征进行选择。因此,在应用的基础上第9卷第17期2009年9月1671—1819(2009)17-4978-06(大庆石油学院计算机与信息技术学院,大庆163318)摘要设计了应用于缴费业务领域的动态数据挖掘模型,并引入产生式地知识库系统。解决了动态数据挖掘的算法路径推理问题,并且从软件开发角度设计了动态数据挖掘系统的结构。基于该模型,为油田管理局供水公司开发了用户非信誉行为模式挖掘应用系统。产生式系统信誉行为挖掘BP神经网络决策树中图法分类号TPl83;文献标志码A第一作者简介:高雅田(1979一),女,黑龙江省绥滨县人,大庆石油学院计算机科学与信息技术学院博士研究生。研究方向:人工智’通信作者简介:李春生(1960一),男,大庆石油学院计算机科学与信息技术学院教授、博士生导师,研究方向:人工智能及其应用,模2009年5月6日收到能o式识别与人工智能。ScienceTechnologyandEngineeringV01.9No.17Sep.2009Sei.Tech.Engn昏. 万方数据 广一—.⋯—.j莎—.—..⋯一.L一一一一一0一一一一一一J!I规则库I·I综合数据库l结合数据挖掘的通用知识和应用领域的业务要求搜索符合应用领域挖掘任务特点的算法路径。算(数值型、非数值型或者离散还是连续),任务目标(评估或者预测),业务名称(挖掘任务的标志)等几方面描述数据挖掘任务,基于产生式建立数据挖掘瞰据挖掘算法模块构件库I矧JIR^:9耳(ANpE驰)_+c^其中m,,l>1,k=1,2,⋯,r;RI表示第K条规则,CI表示第K条规则的结论。通常,把用产生式知识表系统(又叫产生式规则)既有Post严格理论证明的式化基础,在这个过程中需要比较全面的知识描知的情况下,如分类任务挖掘建模可以选用的决策以选用决策树算法,在此针对不同前提条件存在了由If-Then表达的可选路径。挖掘路径知识处理的组成框架如图2所示,挖掘路径原子知识的组合方法有一对多、多对一、一置,系统将数据挖掘算法执行模块和控制系统分离,采用这种结果主要是控制逻辑和具体算法的实现逻辑进行分割,有利于系统维护和算法在不同方案中的调度。从软件实现角度,结合挖掘领域通用知识及应用领域专业知识,系统得出有意义的算法路径,并且将路径送人算法路径队列中,数据挖掘控制系统根据算法路径调度实现挖掘功能的模块,并且保存结果。算法运行模块是算法家族中的一员,他们之间各不相同,控制系统必须随时调度这些模块,即参加运算的模块随时可能产生变化,如何管理变化点是调度机制设计的重点。软件开发需要考虑系统的灵活性与伸缩性,设计时考虑算法模块的加入及删除是否对系统影响较