预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于主题模型的多示例多标记学习方法摘要:针对现有的大部分多示例多标记(MIML)算法都没有考虑如何更好地表示对象特征这一问题将概率潜在语义分析(PLSA)模型和神经网络(NN)相结合提出了基于主题模型的多示例多标记学习方法。算法通过概率潜在语义分析模型学习到所有训练样本的潜在主题分布该过程是一个特征学习的过程用于学习到更好的特征表达用学习到的每个样本的潜在主题分布作为输入来训练神经网络。当给定一个测试样本时学习测试样本的潜在主题分布将学习到的潜在主题分布输入到训练好的神经网络中从而得到测试样本的标记集合。与两种经典的基于分解策略的多示例多标记算法相比实验结果表明提出的新方法在现实世界中的两种多示例多标记学习任务中具有更优越的性能。关键词:主题模型;特征表达;多示例多标记学习;场景分类;文本分类中图分类号:TP181文献标志码:AMultiinstancemultilabellearningmethodbasedontopicmodelYANKaobi1LIZhixin12*ZHANGCanlong121.GuangxiKeyLaboratoryofMultiSourceInformationMiningandSecurityGuangxiNormalUniversityGuilinGuangxi541004China2.GuangxiExperimentCenterofInformationScienceGuilinGuangxi541004ChinaAbstract:ConcerningthatmostofthecurrentmethodsforMultiInstanceMultiLabel(MIML)problemdonotconsiderhowtorepresentfeaturesofobjectsinanevenbetterwayanewMIMLapproachcombinedwithProbabilisticLatentSemanticAnalysis(PLSA)modelandNeuralNetwork(NN)wasproposedbasedontopicmodel.TheproposedalgorithmlearnedthelatenttopicallocationofallthetrainingexamplesbyusingthePLSAmodel.Theaboveprocesswasequivalenttothefeaturelearningforgettingabetterfeatureexpression.Thenitutilizedthelatenttopicallocationofeachtrainingexampletotraintheneuralnetwork.Whenatestexamplewasgiventheproposedalgorithmlearneditslatenttopicdistributionthenregardedthelearnedlatenttopicallocationofthetestexampleasaninputofthetrainedneuralnetworktogetthemultiplelabelsofthetestexample.TheexperimentalresultsoncomparisonwithtwoclassicalalgorithmsbasedondecompositionstrategyshowthattheproposedmethodhassuperiorperformanceontworealworldMIMLtasks.英文关键词Keywords:topicmodel;featureexpression;multiinstancemultilabellearning;sceneclassification;textcategorization0引言传统的监督学习问题通常定义为单示例单标记学习问题一个对象用一个示例来表示同时关联一个标记。定义X为示例空间Y为标记集合。