一种数据去重方法及装置.pdf
王秋****哥哥
亲,该文档总共76页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种数据去重方法及装置.pdf
本申请公开一种数据去重方法及装置,该数据去重方法包括:获取待存储到目标存储空间中的第一数据;确定该第一数据与目标特征值是否相同,该目标特征值为标号对应关系中记录的一个或多个特征值中的任意一个特征值;该一个或多个特征值已存储到数据块中;标号对应关系中包括特征值与特征标号之间的关联关系;在确定第一数据与目标特征值相同的情况下,不将该第一数据存储到目标存储空间的数据块中,在第一地址项中记录目标特征标号;该目标特征标号为标号对应关系中与目标特征值对应的特征标号;第一地址项中包括第一标记位,第一标记位取值为第一数值
一种数据去重方法及装置.pdf
本申请公开一种数据去重方法及装置,该数据去重方法包括:获取待存储到目标存储空间中的第一数据,目标存储空间中已存储M个数据块,M为正整数;计算第一数据的数据内容的总和校验码;在确定第一数据的数据内容的总和校验码与M个数据块的数据内容的总和校验码都不相同的情况下,为第一数据分配第一数据块,将第一数据存储到第一数据块中;在确定第一数据的数据内容的总和校验码与M个数据块中的第二数据块的数据内容的总和校验码相同,且第二数据块的数据内容与第一数据的数据内容相同的情况下,将第二数据块的地址信息作为存储第一数据的数据块的
一种基于数据库的水表数据去重方法及装置.pdf
本发明公开了一种基于数据库的水表数据去重方法及装置,涉及智能抄表技术领域。所述方法包括数据解析过程、本地时间段获取过程、数据库时间段获取过程、数据去重过程以及信息更新过程,通过保留数据抄表的最小最大值作为时间范围段,在精确去重的前提下还节省了存储空间,同时还能适配不通间隔时间单位的数据。本发明提供的一种基于数据库的水表数据去重方法及装置,既可以省略标志位的存储空间,又可以适应任一的时间间隔且能实现严格的去重,还能通过本地内存作为缓存的方式可以高效去重提高系统性能。
一种衍生数据的去重方法.pdf
本发明提供了一种衍生数据的去重方法,应用于计算机安全领域,所述方法包括:对目标资源包进行处理,获取目标资源包对应的初始文件列表和任一初始文件对应的衍生文件列表,并基于衍生文件对应的标识向量与任一关键标识向量,获取初始文件对应的相似度列表;根据衍生文件对应的标识向量与任一关键标识向量之间的相似度,确定出衍生文件为初始文件对应的第一类衍生文件还是初始文件对应的第二类衍生文件且对初始文件对应的第一类衍生文件和初始文件对应的第二类衍生文件分别处理;重复上述步骤获取初始文件对应的目标结构树。本发明提供的一种衍生数据
一种资讯去重的方法及装置.pdf
本发明公开了一种资讯去重的方法,包括:根据资讯的网址进行第一层去重,当目标数据库中已保存有该网址时,丢弃该资讯;根据去除符号后的资讯标题进行第二层去重,当目标数据库中已保存有去除符号后的资讯标题时,丢弃该资讯;根据关键词进行第三层去重,当目标数据库中已保存有资讯的关键词及关键词的词频时,丢弃该资讯;通过三重去重保障,能有效的保证数据库中的数据不出现重复的资讯文章,从而避免用户重复浏览内容相同的网页。