预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共53页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

河北工业大学硕士学位论文基于抽样的隐私保护聚类挖掘算法研究姓名:刘风丽申请学位级别:硕士专业:管理科学与工程指导教师:吴晓丹20071101河北工业大学硕士学位论文基于抽样的隐私保护聚类挖掘算法研究摘要数据分析与处理技术迅速发展在公布或共享数据以挖掘有效决策信息和知识的同时不免暴露出个人和公司隐私泄露问题进而催生了隐私保护数据挖掘这一研究领域并在近三年成为国内外研究者关注的焦点。数据挖掘中的聚类挖掘是分析管理问题的重要方法之一常应用于市场细分、客户分类与制造系统单元化设计等重要领域而要得到这些结果则需要涉及大量详细具体的敏感性数据和信息与此同时数据中潜在的模式和规律也很有可能对隐私和信息安全构成威胁。因此随着客户个性化需求时代的急速发展聚类隐私保护算法也成为亟待解决的关键隐私保护数据挖掘问题。目前关于隐私保护聚类挖掘算法才刚刚起步采用的隐私保护算法也相对简单且现有的隐私保护聚类算法在效率效果上均存在着难以调和的矛盾。基于这种现状本文提出了抽样隐私保护聚类算法在保证数据隐私性和聚类结果准确性的同时还可以处理大规模数据。论文主要贡献在于依据基于密度和基于模型聚类算法可构建聚类分布函数的原理构造了均匀抽样、一元正态和多元正态抽样等三种聚类分布函数。并指出加和模糊系统与高斯混合函数的等价性确立了基于模糊C均值聚类统计结果的分布函数参数的最优估计进而应用随机抽样技术产生了既具原始数据聚类特征又能保护隐私的新数据并给出了算法流程的详细描述。最后通过仿真实验验证了本文算法的有效性并给出了各种隐私保护聚类方法的优势和适用条件。关键词:数据挖掘隐私保护聚类分析抽样i河北工业大学硕士学位论文RESEARCHONPRIVACYPRESERVINGCLUSTERINGMININGALGORITHMBASEDONSAMPLINGTECHNIQUEABSTRACTWiththedevelopmentofdataanalysisandprocessingtechniquetheprivacyleakproblemaboutindividualorcompanyisinevitablyexposedwhenreleasingorsharingdatatomineusefuldecisioninformationandknowledgethengivethebirthtotheresearchfieldonprivacypreservingdataminingandbecomethefocusoftheresearcherhomeandabroadinrecentthreeyears.Clusteringindataminingisoneoftheimportantmethodstoanalyzemanagementproblemsuchasmarketsegmentationcustomerclassificationandmanufacturingsystemmoduledesignandsoon.Inordertoobtaintheseresultsitinvolvesalargenumberofdetailedsensitiveinformation.Atthesametimethepotent