预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114282241A(43)申请公布日2022.04.05(21)申请号202111601528.0(22)申请日2021.12.24(71)申请人杭州天宽科技有限公司地址310012浙江省杭州市西湖区万塘路252号1幢15楼1501室(72)发明人龚徐建陈义松李勇(74)专利代理机构杭州裕阳联合专利代理有限公司33289代理人高明翠(51)Int.Cl.G06F21/60(2013.01)H04L9/00(2022.01)权利要求书3页说明书4页附图1页(54)发明名称一种基于数据分析的数据加密系统(57)摘要本发明公开了一种基于数据分析的数据加密系统,通过数据截取单元获取到目标信息,之后自动分析目标信息的特性,根据其特性得到目标分词组后,利用接驳搜寻单元自动对目标分析组进行接驳分析,得到五个关联信息构成关联信息组;再利用所述混合处理器结合混乱数据库对关联信息组和目标数据进行混合关联处理;再对目标数据和关联信息进行混乱处理,得到处理后的目标数据,即为加密数据;本申请能够从增补关联信息,并根据关联信息和目标数据中提取关键点,便于区分,同时对关联信息和目标数据还有自己的加密方式,形成两道加密;本申请简单有效,且易于实用。CN114282241ACN114282241A权利要求书1/3页1.一种基于数据分析的数据加密系统,其特征在于,包括:特性分析单元:其对目标信息进行特性分析,得到所有目标分词构成的目标分词组并传输到接驳搜寻单元;接驳搜寻单元:其自动对目标分词组进行接驳分析,得到五个关联信息构成关联信息组并传输到混合处理器;所述特性分析单元还用于将目标数据传输到混合处理器;所述混合处理器用于结合混乱数据库对关联信息组和目标数据进行混合关联处理,获取对应关联信息和目标数据的识别值;再对目标数据进行混乱处理,得到处理后的目标数据,标记为加密数据;将目标数据和关联信息组内所有关联信息的识别值,标记为对应加密数据和加密关联数据的文件名,得到的数据标记为处理数据组。2.根据权利要求1所述的一种基于数据分析的数据加密系统,其特征在于,还包括数据截取单元:其用于获取目标信息并传输到特性分析单元,目标信息为文字内容的文本信息;特性分析具体步骤为:步骤一:获取到目标数据;步骤二:之后对目标数据进行分词处理,得到若干个组成分词;步骤三:获取到预设的助词词库,助词词库内预先设置有若干无实际意义的助词,将组成分词里面的助词去除后,剩余的标记为核心分词;步骤四:之后获取到在目标数据内,所有核心分词的出现次数,将该次数除以所有核心分词一共出现的次数,得到每个核心分词的重复占比;步骤五:将重复占比超过X1的核心分词标记为目标分词;当所有的重复占比没有超过X1的时候,自动将核心分词按照重复占比从大到小的顺序进行排序,将排名前百分之二十五和排名后百分之十的核心分词标记为目标分词;步骤六:得到所有目标分词构成的目标分词组。3.根据权利要求1所述的一种基于数据分析的数据加密系统,其特征在于,接驳分析具体步骤为:S1:获取到所有的目标分词组;S2:根据目标分词组进行相似内容搜索,即为利用关键词搜索相关目标分词组内目标分词的文章,得到若干个相似内容,将其标记为相似信息;S3:获取到所有的相似信息,之后任选一相似信息;S4:获取到该相似信息内目标分词的个数,得到目标分词的复现次;S5:将复现次除以目标分词组内目标分词的总个数,得到复现比例;S6:任选下一相似信息,重复步骤S4‑S6,对所有的相似信息处理完毕之后,得到所有的相似信息的复现比例;S7:根据复现比例从大到小的顺序进行排序,取排名前五的标记为关联信息,五个关联信息构成关联信息组。4.根据权利要求3所述的一种基于数据分析的数据加密系统,其特征在于,步骤S4中获取到相似信息内目标分词的个数,指代为对应目标分词出现了几个,一个目标分词出现多次的时候仅记为一次。2CN114282241A权利要求书2/3页5.根据权利要求1所述的一种基于数据分析的数据加密系统,其特征在于,混乱数据库内存储有混合关联处理规则,混合关联处理具体步骤为:SS1:获取到目标数据;SS2:对目标数据进行扩充选取,得到目标数据的扩充值;SS3:获取到所有的关联信息组内的关联信息,按照扩充选取的相同原理,得到所有关联信息的扩充值,将该扩充值重新标定为关联扩充值;SS4:对关联扩充值进行相同判定,具体为:若关联扩充值中存在与扩充值一致的数值,则将扩充值和该相同的前面增加一个特性值;在扩充值的首位增加一个数字1,所有的关联扩充值前增加数字2;若关联扩充值中不存在与扩充值一致的数值,则在关联扩充值和扩充值的首位均增加数字1;将判定后的扩充值和关联扩充值统一标定为识别值;SS5:获取