预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114186231A(43)申请公布日2022.03.15(21)申请号202111514446.2(22)申请日2021.12.10(71)申请人中国电信股份有限公司地址100033北京市西城区金融大街31号(72)发明人高思雨闻剑峰殷铭(74)专利代理机构中国贸促会专利商标事务所有限公司11038代理人郭思宇(51)Int.Cl.G06F21/56(2013.01)G06K9/62(2022.01)G06V20/62(2022.01)G06F40/284(2020.01)G06F16/35(2019.01)G06N3/04(2006.01)权利要求书2页说明书5页附图6页(54)发明名称检测赌博APP的方法和系统以及存储介质(57)摘要本发明涉及检测赌博APP的方法和系统以及存储介质。检测赌博APP的方法包括:利用相似度匹配算法,计算待检测APP的静态特征与APP特征黑库中的静态特征之间的相似度,其中所述静态特征包括APP名称、包名、开发者签名、图标、smali源码和strings.xml中的至少一个的APP静态特征;在相似度大于第一预定阈值的情况下,动态安装、运行APK,获取动态加载后的APP小图和首页页面;提取图像矩阵,利用小目标优化后的目标检测模型获取赌博元素特征向量;获取图像文本,计算LDA主题词向量,使用特征选取方法选取分类词向量,利用自定义文本分类模型计算文本特征作为文本特征向量;融合赌博元素特征向量和文本特征向量,利用分类模型计算待检测的APP疑似为赌博APP的疑似概率。CN114186231ACN114186231A权利要求书1/2页1.一种检测赌博APP的方法,包括:利用相似度匹配算法,计算待检测APP的静态特征与应用程序APP特征黑库中的静态特征之间的相似度,其中所述静态特征包括APP名称、包名、开发者签名、图标、smali源码和strings.xml中的至少一个的APP静态特征;在相似度大于第一预定阈值的情况下,动态安装、运行安卓应用程序包APK,获取动态加载后的APP小图和首页页面;提取图像矩阵,利用小目标优化后的目标检测模型来目标检测赌博元素,获取赌博元素特征向量;获取图像文本,计算LDA主题词向量,使用特征选取方法选取分类词向量,利用自定义文本分类模型计算文本特征作为文本特征向量;融合赌博元素特征向量和文本特征向量,利用分类模型计算待检测的APP疑似为赌博APP的疑似概率;以及将疑似概率与第二预定阈值进行比较,在疑似概率大于第二预定阈值的情况下,将待检测的APP确定为赌博APP。2.根据权利要求1所述的方法,其中获取APP的静态特征包括:提取待检测的APP的原APK文件信息,其包括APP名称、包名、开发者签名、smali源码和strings.xml中的至少一个的APP静态特征;预处理smali源码,利用压缩方法提取samli源码信息;以及利用离散余弦变换多分箱哈希方法,获取APP的图标特征。3.根据权利要求1或2所述的方法,还包括:利用相似度匹配算法,计算待检测APP的静态特征与APP白名单库中的静态特征之间的相似度;在相似度小于第三预定阈值的情况下,确定待检测APP为正常APP。4.根据权利要求1或2所述的方法,其中利用小目标优化后的目标检测模型来目标检测赌博元素,获取赌博元素特征向量包括:检测赌博元素,所述赌博元素包括轮盘、筹码、彩球、扑克和骰子中的至少一个;将图像矩阵输入小目标优化后的YOLO目标检测模型,Yolo模型优化后的加权损失函数L为:其中pi,为每一个锚框类别的真值和预测值,ti,为每一个锚框与地面真值的偏差真值与预测值,w和h为地面真值的宽和高,FL(,)为目标检测的分类损失函数,Lreg为回归损失,λ和μ为权重,其中0≤λ≤1,0≤μ≤1,c为大于0的常数,Ncls为检测的物体类别;以及计算赌博元素轮盘、筹码、彩球、扑克和骰子中的至少一个的最大概率、平均概率和数量统计特征,作为赌博元素特征向量。5.根据权利要求1或2所述的方法,其中利用自定义文本分类模型,计算文本特征向量包括:计算LDA加权主题词向量,使用特征选取方法选取分类词向量;将光学符号识别后的图像文本输入自定义文本分类模型,使用多尺度卷积层,构建1‑2CN114186231A权利要求书2/2页gram,……,n‑gram多元文本特征;进行动态maxpooling层过滤以获取多元文本特征1‑层,3‑层,……,n‑层;使用dropout层进行模型平均,将多元特征concat成一维特征,加入Relu激活函数的全连接层;以及计算抑制词、灰词、激励词文本特征作为文本特征向量。6.一种用于检测赌博APP的系统,包括:APP静态特征获取单元(101),用