一种基于改进朴素贝叶斯的涉密文本识别方法-豆柴文库

一种基于改进朴素贝叶斯的涉密文本识别方法.pdf

2023-12-05

10金币

723KB

12页

邻家****文章

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共12页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109145308A(43)申请公布日2019.01.04(21)申请号201811134941.9(22)申请日2018.09.28(71)申请人乐山师范学院地址614000四川省乐山市市中区滨河路778号(72)发明人敬思远杨骏孙锐郭肇毅(74)专利代理机构成都方圆聿联专利代理事务所(普通合伙)51241代理人李鹏(51)Int.Cl.G06F17/27(2006.01)权利要求书3页说明书6页附图2页(54)发明名称一种基于改进朴素贝叶斯的涉密文本识别方法(57)摘要本发明公开了一种基于改进朴素贝叶斯的涉密文本识别方法，包括以下步骤：S1.构建朴素贝叶斯模型并进行增量式学习；S2.加载增量式学习得到的朴素贝叶斯模型；S3.读取待识别的文本；S4.利用朴素贝叶斯模型对文本进行识别，并标注其对应的密级。本发明中，基于朴素贝叶斯加权模型使得学习更加合理，并提出了特征权重的增量学习方案，能够大幅提升涉密文本检测的准确率；基于涉密特征空间改变的进行增量学习，简单有效地解决了有新的涉密特征加入或者有旧的涉密特征的密级下降的问题。CN109145308ACN109145308A权利要求书1/3页1.一种基于改进朴素贝叶斯的涉密文本识别方法，其特征在于：包括以下步骤：S1.构建朴素贝叶斯模型并进行增量式学习；S2.加载增量式学习得到的朴素贝叶斯模型；S3.读取待识别的文本；S4.利用朴素贝叶斯模型对文本进行识别，并标注其对应的密级。2.根据权利要求1所述的一种基于改进朴素贝叶斯的涉密文本识别方法，其特征在于：还包括识别结果上传步骤：将步骤S4的识别结果上传到统一的控制中心。3.根据权利要求1所述的一种基于改进朴素贝叶斯的涉密文本识别方法，其特征在于：所述步骤S1包括以下子步骤：S101.构建朴素贝叶斯模型对带有用户标注标签的样本进行识别；S102.统一控制中心管理员将识别出的标签与用户标注的标签进行对比，如果是识别错误的，就将该样本及其正确标签加入到样本库；S103.构建朴素贝叶斯加权模型；S104.涉密特征空间中有新的涉密特征加入或者有旧的涉密特征密级发生变化时，基于涉密特征空间改变的进行增量学习；S105.根据样本库和涉密特征库的变化进行增量式学习；S106.将学习后的模型写入到朴素贝叶斯模型中，并通知系统进行重新加载。4.根据权利要求3所述的一种基于改进朴素贝叶斯的涉密文本识别方法，其特征在于：所述步骤S101包括：第一、构建朴素贝叶斯模型：设涉密文本的样本空间D由特征空间W＝{w1,w2,…,wn}和类别空间C＝{c1,c2,…,cm}组成；样本空间D即文本中包含的词，类别空间C即涉密文本的密级；对一个给定文本d＝{w1,w2,…,wl}，朴素贝叶斯模型通过计算该文本属于各类别的后验概率，对其所属类别进行判别；哪个类别的后验概率大，该文本的检测结果就是对应的那个类别，判别式如下：其中P(ci)表示类别的先验概率；P(wj|ci)表示在类别ci条件下，特征wj出现的概率：其中|C|、|D|和|W|分别表示类别空间、样本空间和特征空间的大小；count(ci)表示属于类别ci的样本数，count(wj∧ci)表示在类别ci中出现特征wj的样本数；第二、利用朴素贝叶斯模型对带有用户标注标签的样本进行识别，得到各个样本的识别结果。5.根据权利要求3所述的一种基于改进朴素贝叶斯的涉密文本识别方法，其特征在于：所述步骤S103包括：第一、构建朴素贝叶斯加权模型：2CN109145308A权利要求书2/3页λj,i表示特征空间中第j个特征属于第i个类别的权重，按照Bell_Lapadula模型，每个特征都有4个权重，分别对应公开、秘密、机密和绝密：其中TFi(wj)是文本特征wj在ci类别文本中出现的词频；IDFi(wj)是改进的逆文档频率；文本特征在类内文档数越大，在其它类中出现的文档数越小，则其权重越大。6.根据权利要求3所述的一种基于改进朴素贝叶斯的涉密文本识别方法，其特征在于：所述步骤S104包括：涉密特征空间中有新的涉密特征加入或者有旧的涉密特征密级发生变化时，新特征加入的情况：首先从与新特征同类别的其它特征中选择P(tj|ci)值最大的特征，将其所有信息均拷贝给新特征，按照步骤S103对所有特征在该类别下的权重λj,i和条件概率P(wj|ci)进行重新估计；然后从与新特征不同类别的其它特征中选择P(tj|ci)值最小的特征，将其所有信息均拷贝给新特征，然后按照步骤S103对所有特征在该类别下的权重λj,i和条件概率P(wj|ci)进行重新估计；对于旧特征涉密特征密级发生变化的情况同理，首先从与变化特征同类别的其它特征中选择P(tj|ci)值最大的特征，将

相关资料

一种基于改进朴素贝叶斯的涉密文本识别方法.pdf

本发明公开了一种基于改进朴素贝叶斯的涉密文本识别方法，包括以下步骤：S1.构建朴素贝叶斯模型并进行增量式学习；S2.加载增量式学习得到的朴素贝叶斯模型；S3.读取待识别的文本；S4.利用朴素贝叶斯模型对文本进行识别，并标注其对应的密级。本发明中，基于朴素贝叶斯加权模型使得学习更加合理，并提出了特征权重的增量学习方案，能够大幅提升涉密文本检测的准确率；基于涉密特征空间改变的进行增量学习，简单有效地解决了有新的涉密特征加入或者有旧的涉密特征的密级下降的问题。

2023-12-05

723KB

基于朴素贝叶斯的文本情感倾向识别方法研究的开题报告.docx

基于朴素贝叶斯的文本情感倾向识别方法研究的开题报告一、选题背景和研究意义随着互联网技术的不断发展，人们在网络上交流的频率越来越高，大量的文本数据被不断生成。同时，情感分析也越来越受到人们的关注，它可以帮助企业或个人更好地了解消费者或网民对自己产品或言论的情感态度，进而制定更合适的决策。因此，基于文本情感识别的研究越来越受到关注。朴素贝叶斯分类器是目前最常使用的文本分类算法之一，它具有分类效果好、计算速度快的优点，应用广泛。同时，在情感识别方面，朴素贝叶斯分类器也有较高的准确率。因此，本研究将探究如何基于朴

2024-09-16

11KB

基于朴素贝叶斯方法的文本分类研究的开题报告.docx

基于朴素贝叶斯方法的文本分类研究的开题报告一、研究背景及意义随着网络时代的发展，信息爆炸式增长，人们需要快速精准地获取所需信息，因此文本分类技术得到了广泛的关注和应用。文本分类是指将给定文本按预先定义好的类别进行分类，广泛应用于文本挖掘、智能搜索、情感分析等领域。例如，在电商平台中，可以根据购买历史和兴趣爱好将用户进行分类，做出个性化推荐；在新闻媒体中，可以将不同主题的新闻进行分类，方便用户获取自己关注的内容。朴素贝叶斯是一种基于概率的方法，能够进行有效的文本分类。其思想是先计算每个类别下各特征出现的概率

2024-09-15

11KB

一种基于朴素贝叶斯模型的乐器种类识别方法和系统.pdf

本发明涉及一种基于朴素贝叶斯模型的乐器种类识别方法和系统，包括以下步骤：S1将待识别的乐曲分为若干音频帧；S2提取音频帧中的时域信息、频域信息与倒频域信息以及梅尔频率倒谱系数，形成与音频帧对应的特征向量；S3将若干个乐器对应的音频特征向量和所有的音频帧对应的特征向量输入至朴素贝叶斯模型，根据乐器出现在乐曲中的概率对乐器进行识别。其通过这种数据化的音乐特征提取的方式，实现人工智能对乐器的种类、音色、技法的识别，帮助精细化区分其同质化和异质化乐器之间的关系，尤其是同质性乐器种类的音响细分、音色相似度、技术重合

2023-06-25

475KB

一种改进的选择性朴素贝叶斯方法.pdf

本发明公开的一种改进的选择性朴素贝叶斯方法，包括以下步骤：将WoE值和IV值引入属性选择中，得到与类别相关度较高的属性子集，构造朴素贝叶斯分类器；然后在其基础上进一步删除冗余属性，得到最优属性子集。本发明改进的选择性朴素贝叶斯方法现有的贝叶斯算法的基础上，将WoE和IV指标引入属性选择，提高朴素贝叶斯在属性冗余时的分类性能，同时在属性不冗余的情况下保持朴素贝叶斯的分类性能；根据阈值筛选得到第一轮属性子集，从而减少了遍历空间，解决了在减少属性维度的同时提高分类的正确性的问题。

2023-08-30

618KB