一种识别隐私数据的方法、装置、设备和可读介质.pdf
论文****酱吖
亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种识别隐私数据的方法、装置、设备和可读介质.pdf
本说明书实施例公开了一种识别隐私数据的方法、装置、设备和可读介质。该方法包括:获取待识别数据的元数据;将所述元数据输入第一多分类模型以对所述待识别数据的数据类型进行识别,得到第一识别结果;所述第一多分类模型是基于隐私类型数据对应的元数据进行训练得到的;若所述第一识别结果表示所述待识别数据属于隐私数据,则根据所述第一识别结果确定所述待识别数据所属的隐私类型;若所述第一识别结果表示所述待识别数据不属于隐私数据,则将所述元数据和所述待识别数据输入第二多分类模型,得到第二识别结果;根据所述第二识别结果确定所述待识
一种隐私数据识别方法、装置、设备和可读介质.pdf
本说明书实施例公开了一种隐私数据识别方法、装置、设备和可读介质。方案包括:获取第一数据集的第一长度分布向量和第一字符分布统计信息,所述第一数据集为隐私数据样本的集合;获取第二数据集的第二长度分布向量和第二字符分布统计信息,所述第二数据集为待识别字段对应的至少部分数据样本的集合;计算所述第一数据集与所述第二数据集的长度分布相似度、字符分布相似度,并基于所述长度分布相似度和字符分布相似度确定所述待识别字段对应的数据是否为与所述第一数据集同类型的隐私数据。
一种隐私数据识别和处理方法、装置、设备和可读介质.pdf
本说明书实施例公开了隐私数据识别和处理方法、装置、设备及计算机可读介质。方案包括:采用预先训练的命名实体识别模型,确定目标字段的多条数据中的隐私序列的位置信息和序列隐私类型信息;从而得到所述多条数据的隐私结构类型,所述隐私结构类型包括非隐私结构类型、单序列隐私结构类型和复合序列隐私结构类型;进而确定所述目标字段的隐私结构类型;然后对所述目标字段添加用于表示所述目标字段的隐私结构类型的标签,所述标签可以用于指示采用与所述标签对应的数据脱敏方式对所述目标字段的数据进行脱敏处理。
一种数据识别方法、装置、设备和可读介质.pdf
本说明书实施例公开了一种数据识别方法、装置、设备和计算机可读介质。方案包括:获取第一数据集,所述第一数据集中的数据样本为待识别字段的至少部分数据;获取基于第二数据集中的数据样本统计得到的状态转移矩阵集合,所述第二数据集中数据样本的数据类型是已知的;基于所述状态转移矩阵集合,确定所述第一数据集中各数据样本对应的样本状态转移概率;确定所述第一数据集中所述样本状态转移概率大于第一阈值的数据样本的数量相对所述第一数据集中数据样本的总数量的比例;若所述比例大于第二阈值,则将所述待识别字段对应的数据确定为与所述第二数
一种隐私数据定价方法、装置、设备及可读存储介质.pdf
本申请涉及一种隐私数据定价方法、装置、设备及可读存储介质,涉及数据交易技术领域,包括根据买家发布的数据对象分析函数从原始数据库中筛选出第一原始数据集并基于与可接受数据精度对应的噪声尺度对第一原始数据集进行处理得到隐私数据集;基于隐私数据集的数据含量、均方根误差分别计算信息熵和精度损失,根据信息熵和精度损失计算数据价值;根据隐私数据集的属性极限值、数据对象分析函数的敏感度和可接受数据精度计算隐私含量并基于隐私含量计算隐私成本;基于数据价值、隐私成本和数据市场系数计算数据利润;根据数据价值、隐私成本和数据利润