(2)判别模型、生成模型与朴素贝叶斯方法-豆柴文库

(2)判别模型、生成模型与朴素贝叶斯方法.pdf

2024-08-30

15金币

1MB

10页

as****16

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

判别模型、生成模型与朴素贝叶斯方法 JerryLead csxulijie@gmail.com 2011年3月5日星期六 1判别模型与生成模型上篇报告中提到的回归模型是判别模型，也就是根据特征值来求结果的概率。形式化表示为푝(푦|푥;휃)，在参数휃确定的情况下，求解条件概率푝(푦|푥)。通俗的解释为在给定特征后预测结果出现的概率。比如说要确定一只羊是山羊还是绵羊，用判别模型的方法是先从历史数据中学习到模型，然后通过提取这只羊的特征来预测出这只羊是山羊的概率，是绵羊的概率。换一种思路，我们可以根据山羊的特征首先学习出一个山羊模型，然后根据绵羊的特征学习出一个绵羊模型。然后从这只羊中提取特征，放到山羊模型中看概率是多少，再放到绵羊模型中看概率是多少，哪个大就是哪个。形式化表示为求푝(푥|y)（也包括푝(푦)），y是模型结果，x是特征。利用贝叶斯公式发现两个模型的统一性：由于我们关注的是y的离散值结果中哪个概率大（比如山羊概率和绵羊概率哪个大），而并不是关心具体的概率，因此上式改写为：其中푝(푥|y)称为后验概率，푝(푦)称为先验概率。由푝(푥|y)∗푝(푦)=푝(푥,푦)，因此有时称判别模型求的是条件概率，生成模型求的是联合概率。常见的判别模型有线性回归、对数回归、线性判别分析、支持向量机、boosting、条件随机场、神经网络等。常见的生产模型有隐马尔科夫模型、朴素贝叶斯模型、高斯混合模型、LDA、Restricted BoltzmannMachine等。这篇博客较为详细地介绍了两个模型： http://blog.sciencenet.cn/home.php?mod=space&uid=248173&do=blog&id=227964 2高斯判别分析（Gaussiandiscriminantanalysis） 1）多值正态分布多变量正态分布描述的是n维随机变量的分布情况，这里的μ变成了向量，σ也变成了矩阵Σ。写作훮(휇,훴)。假设有n个随机变量푋1,푋2,…,푋푛。μ的第i个分量是E(X푖)，而 Σii=Var(푋푖)，Σij=Cov(푋푖,푋푗)。概率密度函数如下：其中|Σ|是Σ的行列式，Σ是协方差矩阵，而且是对称半正定的。当μ是二维的时候可以如下图表示：其中μ决定中心位置，Σ决定投影椭圆的朝向和大小。如下图：对应的Σ都不同。 2）模型分析与应用如果输入特征x是连续型随机变量，那么可以使用高斯判别分析模型来确定p(x|y)。模型如下：输出结果服从伯努利分布，在给定模型下特征符合多值高斯分布。通俗地讲，在山羊模型下，它的胡须长度，角大小，毛长度等连续型变量符合高斯分布，他们组成的特征向量符合多值高斯分布。这样，可以给出概率密度函数：最大似然估计如下：注意这里的参数有两个μ，表示在不同的结果模型下，特征均值不同，但我们假设协方差相同。反映在图上就是不同模型中心位置不同，但形状相同。这样就可以用直线来进行分隔判别。求导后，得到参数估计公式： Φ是训练样本中结果y=1占有的比例。 μ0是y=0的样本中特征均值。 μ1是y=1的样本中特征均值。 Σ是样本特征方差均值。如前面所述，在图上表示为：直线两边的y值不同，但协方差矩阵相同，因此形状相同。μ不同，因此位置不同。 3）高斯判别分析（GDA）与logistic回归的关系将GDA用条件概率方式来表述的话，如下： y是x的函数，其中都是参数。进一步推导出这里的θ是的函数。这个形式就是logistic回归的形式。也就是说如果p(x|y)符合多元高斯分布，那么p(y|x)符合logistic回归模型。反之，不成立。为什么反过来不成立呢？因为GDA有着更强的假设条件和约束。如果认定训练数据满足多元高斯分布，那么GDA能够在训练集上是最好的模型。然而，我们往往事先不知道训练数据满足什么样的分布，不能做很强的假设。Logistic 回归的条件假设要弱于GDA，因此更多的时候采用logistic回归的方法。例如，训练数据满足泊松分布，，那么p(y|x)也是logistic回归的。这个时候如果采用GDA，那么效果会比较差，因为训练数据特征的分布不是多元高斯分布，而是泊松分布。这也是logistic回归用的更多的原因。 3朴素贝叶斯模型在GDA中，我们要求特征向量x是连续实数向量。如果x是离散值的话，可以考虑采用朴素贝叶斯的分类方法。假如要分类垃圾邮件和正常邮件。分类邮件是文本分类的一种应用。假设采用最简单的特征描述方法，首先找一部英语词典，将里面的单词全部列出来。然后将每封邮件

相关资料

(2)判别模型、生成模型与朴素贝叶斯方法.pdf

2024-08-30

1MB

贝叶斯网络模型代码.doc

贝叶斯网络模型代码贝叶斯网络模型代码贝叶斯网络模型代码addpath(genpathKPM(pwd））N=4;dag=zeros(N，N)；C=1;S=2；R=3；W=4；dag（C，［RS］)=1;dag（R，W)=1;dag（S,W）=1;discrete_nodes=1：N;node_sizes=2*ones（1,N）;bnet=mk_bnet(dag,node_sizes，'discrete'，discrete_nodes）；onodes=[];bnet=mk_bnet(dag,node_size

贝叶斯网络模型代码.doc

基于朴素贝叶斯模型的虚假新闻过滤算法研究.pdf

基于朴素贝叶斯模型的虚假新闻过滤算法研究【摘要】社交媒体是一个高度开放和自由的互联网信息传播平台。随着信息媒体数量的增加随着自媒体的出现每个人都可以在微信微博等平台上发布和接收信息。由于信息量巨大准入和访问机制低给信息交流带来了极大的便利同时也出现了大量的谣言。虚假新闻的负面效应极大地影响了国家和社会的和谐稳定和个人日常生活。因此如何自动有效地识别谣言成为相关领域的研究热点。针对日常中的假新闻问题提出一种自动识别虚假新闻的办法该方法利用计算词向量相关度结合朴素贝叶

2023-10-31

167KB

一种融合词向量模型和朴素贝叶斯的查询词改写方法.pdf

本发明提出一种融合词向量模型和朴素贝叶斯查询改写方法，涉及信息处理技术，该方法利用word2vec训练出向量模型并计算出与查询词最相似的前N个词构成初步的相关词库，然后进行相关度计算和分析得到对查询改写词库的候选词进行过滤，保留相关度高的词语，这种方法可有效提高查询结果的准确度和召回度，有效的解决了搜索查询无结果或者返回有效结果少的难题。

2023-11-22

540KB