预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

研究生学位论文开题报告题目名称:基于隐私保护的多源数据挖掘高效算法研究姓名:学号:专业名称:研究方向:攻读学位:学院:导师姓名:导师职称:填表时间年月日填表说明1.开题报告是研究生培养的重要环节,研究生需在认真完成。2.完成时间:硕士研究生的开题报告应于第三学期末前完成3.打印要求:此表用A4纸双面打印。4.此表与中期考核审核表、成绩单、实践报告、学术活动列表等材料一起交于学院,参加中期考核一、课题来源,国内外研究现状、水平及发展趋势,选题的研究意义、目的,参考文献(一)课题来源1、问题的提出数据挖掘,顾名思义即是从大型数据库中提取人们感兴趣的知识,这些知识是隐含的、事先未知的、潜在的、有用信息,提取的知识表示为概念、规则、规律、模式等形式[1]。数据挖掘要处理的问题,就是在庞大的数据库中寻找有价值的隐藏事件,加以分析,并将这些有意义的信息归纳成结构模式,提供给有关部门决策时参考。目前已经提出的常用方法有关联规则、决策树、聚类、神经网络等方法。然而,在对数据进行挖掘的时候,都不可避免的会出现敏感信息泄露的问题,随着数据挖掘技术的日益发展,数据隐私和信息安全逐渐引起人们的关注。为了保护数据的隐私,人们不愿提供正确的信息给服务商,以免个人信息泄露造成不必要的麻烦,但是数据挖掘结果准确的重要前提是提供的数据正确。由于数据挖掘主要任务是对汇总数据的模式开发,这使得构造一个不需要访问精确的单个信息而获得准确的模式的挖掘技术成为可能。目前,基于隐私保护的数据挖掘技术已经成为一个新颖热门的研究领域,国内外已有很多成熟的研究算法和技术。通过众多文献比对我们发现,目前已有的这些基于隐私保护的数据挖掘算法和技术大多是针对单源数据库进行挖掘和保护,而在实际应用中,有很多情况必须面对多个数据源。例如,许多大型企业、跨国公司都拥有过个子公司,每个子公司都有自己相应的数据库。这就迫切需要数据库挖掘系统具有针对多数据源进行挖掘和保护的能力。已有的国内外文献中,针对多源数据进行挖掘的模型和算法已经出现,但是基于隐私保护技术的多源数据挖掘研究却很少提及。这可能是由于多源数据挖掘本身的技术局限性,导致在对多个数据源进行挖掘时,泄露敏感信息都成为了不可避免的操作。因此,本文在对当前已有的多源序列模式挖掘技术研究的基础上,分析结合并行和隐私保护技术的特点,提出新的基于隐私保护的多源数据挖掘高效算法,使得在多源环境下既可以高效率高准确度的挖掘出高投票率模式(全局模式),又可以隐藏敏感序列模式,达到较好的隐私保护效果。(二)国内外研究现状、水平及发展趋势1、隐私保护技术的研究进展关于数据的隐私保护问题,首次是由AdamN等学者在《Security-controlmethodsforstatisticaldatabases:Acomparisonstudy》[2]一文中提出,文章中提出了一种用扰动的方式来解决数据的隐私保护。所谓“扰动”就是发布数据集失真,数据获得者无法通过其他途径构建出原始数据集,但是这个失真的数据集又仍然保持数据获得者所希望保留的某种特性。基于数据失真的技术还有随机扰动、阻塞和凝聚等。目前常用的隐私保护技术大多都是以统计模型和概率模型为主理论,应用在较低层次的数据隐私保护。在分布式环境中,CliftonC等提出使用SMC(SecureMulti-partyComputation)安全多方计算加密技术保证数据的通信安全[3],这种基于加密的隐私保护技术可适用于科学计算、分布式安全查询、几何计算、分布式数据挖掘等应用。当前,关于SMC的研究主要集中在减低计算开销、以SMC为工具解决问题以及优化分布式计算协议。在国内,关于隐私保护技术的研究主要集中在基于数据失真或数据加密技术方面的研究,如基于隐私保护分类挖掘算法、关联规则挖掘、分布式数据的隐私保护协同过滤推荐、网格访问控制等。(国内研究现状)对数据进行隐私保护,主要可分为在数据发布过程中和在数据挖掘过程中进行。目前已有的针对数据发布的隐私保护技术已经有很多,本文主要讨论数据挖掘中的隐私保护技术。2、隐私保护数据挖掘的研究进展数据挖掘中的隐私保护主要考虑两个方面的问题,一个是敏感的原始数据,一个是从数据库中提取出来的敏感知识。这两种信息都应当在挖掘的时候进行删除,因为可能导致隐私泄露问题。因此,隐私保护数据挖掘的主要目的就是用某种技术改进已有的数据挖掘算法来修改原始数据,使得敏感的数据和知识不被泄露。目前,针对隐私保护数据挖掘的研究,国外已经有很多方法。文献[4]采用数据扰乱技术,从训练数据中重构一个决策树分类器从而解决数据挖掘中隐私保护问题[4]R.Agrawal,R.Srikant.Privacy-preservingdata-mining[C].//Proceedin