预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111859013A(43)申请公布日2020.10.30(21)申请号202010696676.4(22)申请日2020.07.17(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人张亮邓冬瑞李冰涛(74)专利代理机构广州三环专利商标代理有限公司44202代理人熊永强杜维(51)Int.Cl.G06F16/68(2019.01)G06F16/635(2019.01)G06F40/284(2020.01)G06K9/62(2006.01)权利要求书2页说明书11页附图3页(54)发明名称数据处理方法、装置、终端和存储介质(57)摘要本发明实施例公开了一种数据处理方法、装置、终端和存储介质,其中,方法包括,获取预设敏感词,获得与预设敏感词具有词义关联关系的至少一个候选扩展敏感词;获得每个候选扩展敏感词的释义信息;根据每个候选扩展敏感词的释义信息对至少一个候选扩展敏感词进行筛选,得到目标扩展敏感词;从预设曲库中查询目标扩展敏感词对应的敏感内容。通过实施上述方法,可以对敏感词进行扩展并基于扩展内容进行敏感数据查询,提升了对敏感内容的查验全面性。CN111859013ACN111859013A权利要求书1/2页1.一种数据处理方法,其特征在于,所述方法包括:获取预设敏感词,所述预设敏感词为敏感词库中的任意一个敏感词;获得与所述预设敏感词具有词义关联关系的至少一个候选扩展敏感词;获得每个所述候选扩展敏感词的释义信息;根据每个所述候选扩展敏感词的释义信息对所述至少一个候选扩展敏感词进行筛选,得到目标扩展敏感词;从预设曲库中查询所述目标扩展敏感词对应的敏感内容。2.根据权利要求1所述的方法,其特征在于,所述获得与所述预设敏感词具有词义关联关系的至少一个候选扩展敏感词,包括:对所述预设敏感词进行词向量化处理,得到目标词向量;基于词向量之间的距离确定所述目标词向量的相似词向量;将所述相似词向量对应的敏感词确定为所述预设敏感词的候选扩展敏感词。3.根据权利要求2所述的方法,其特征在于,所述基于词向量之间的距离确定所述目标词向量的相似词向量,包括:获取预置数据库中存储的K个词向量,所述K为正整数;计算所述K个词向量中每个词向量与所述目标词向量之间的距离;将所述K个词向量中与所述目标词向量之间距离最小的N个词向量确定为所述目标词向量的相似词向量,所述N为正整数。4.根据权利要求1所述的方法,其特征在于,所述获得与所述预设敏感词具有词义关联关系的至少一个候选扩展敏感词,包括:检测所述预设敏感词是否为实体数据的名称,所述实体数据包括文章、书籍和多媒体数据中的至少一种;若是,则基于预设提取规则从所述实体数据中提取至少一个关键词作为所述预设敏感词的候选扩展敏感词。5.根据权利要求1所述的方法,其特征在于,所述根据每个所述候选扩展敏感词的释义信息对所述至少一个候选扩展敏感词进行筛选,得到目标扩展敏感词,包括:对所述候选扩展敏感词的释义信息进行分词处理,得到至少一个分词词组;检测所述至少一个分词词组中是否存在与所述敏感词库中的敏感词相匹配的分词词组;若存在,则将所述候选扩展敏感词作为目标扩展敏感词。6.根据权利要求1至5任一项所述的方法,其特征在于,所述敏感词库的生成方式包括:获取采用不同语种编写的多个敏感词;将所述多个敏感词进行语言翻译,得到同一目标语种的敏感词;将所述同一目标语种的多个敏感词添加到敏感词库中。7.根据权利要求6所述的方法,其特征在于,所述从预设曲库中查询所述目标扩展敏感词对应的敏感内容,包括:对所述目标扩展敏感词进行翻译,得到至少一个与所述目标扩展敏感词的语种不同的其他语种目标扩展敏感词;以所述目标扩展敏感词以及所述其他语种目标扩展敏感词为检索词,从预设曲库中检2CN111859013A权利要求书2/2页索敏感内容。8.一种数据处理装置,其特征在于,所述装置包括:获取模块,用于获取预设敏感词,所述预设敏感词为敏感词库中的任意一个敏感词;所述获取模块,还用于获得与所述预设敏感词具有词义关联关系的至少一个候选扩展敏感词;所述获取模块,还用于获得每个所述候选扩展敏感词的释义信息;筛选模块,用于根据每个所述候选扩展敏感词的释义信息对所述至少一个候选扩展敏感词进行筛选,得到目标扩展敏感词;查询模块,用于从预设曲库中查询所述目标扩展敏感词对应的敏感内容。9.一种终端,其特征在于,包括处理器、输入接口、输出接口和存储器,所述处理器、输入接口、输出接口和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。