预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115841120A(43)申请公布日2023.03.24(21)申请号202310170278.2(22)申请日2023.02.27(71)申请人文灵科技(北京)有限公司地址102200北京市昌平区未来科学城英才北三街16号院15号楼2单元408室(72)发明人宋永生王楠徐家威(74)专利代理机构无锡苏元专利代理事务所(普通合伙)32471专利代理师王清伟(51)Int.Cl.G06F40/30(2020.01)G06F40/205(2020.01)G06F18/23(2023.01)权利要求书2页说明书8页附图3页(54)发明名称一种基于方面词的主语义分析方法及系统(57)摘要本发明公开了一种基于方面词的主语义分析方法及系统,涉及人工智能领域,所述方法包括:通过获得预设文本的基本特征信息,并确定目标主题;采集目标主题的文本信息并组成目标文本集;分析构建方面词集;遍历得到预设文本的预设方面词集;对预设方面词集进行聚类得到预设方面词类别集;提取预设方面词类别集中任意一个预设方面词类别,并统计任意一个预设方面词类别的出现总次数;对出现总次数降序处理,得到预设方面词类别列表;根据预设方面词类别列表得到主语义分析结果。解决了现有技术在对文本主语义进行分析时忽略方面词含义分析,文本分析速度慢、语义结果不准确,甚至偏离文本主语义的问题。达到了提高文本主语义分析准确率的效果。CN115841120ACN115841120A权利要求书1/2页1.一种基于方面词的主语义分析方法,其特征在于,包括:获得预设文本的基本特征信息,并根据所述基本特征信息确定目标主题;采集所述目标主题的文本信息,并组成目标文本集;对所述目标文本集进行分析,并根据分析结果构建所述目标主题的方面词集;基于所述方面词集对所述预设文本进行遍历,得到所述预设文本的预设方面词集;对所述预设方面词集进行聚类分析得到预设方面词类别集;提取所述预设方面词类别集中任意一个预设方面词类别,并统计得到所述任意一个预设方面词类别的出现总次数;对所述出现总次数进行降序处理,得到预设方面词类别列表;根据所述预设方面词类别列表,得到所述预设文本的主语义分析结果。2.根据权利要求1所述的主语义分析方法,其特征在于,在所述获得预设文本的基本特征信息,并根据所述基本特征信息确定目标主题之前,还包括:获得所述预设文本的摘选来源;获得所述预设文本的撰写用户,并分析确定所述撰写用户的撰写身份;获得所述预设文本的总体字数;基于所述摘选来源、所述撰写身份、所述总体字数,组成所述基本特征信息。3.根据权利要求1所述的主语义分析方法,其特征在于,所述对所述目标文本集进行分析,并根据分析结果构建所述目标主题的方面词集,包括:获得预设停用词;基于所述预设停用词对所述目标文本集进行遍历,得到目标文本停用词;获得剔除指令,并根据所述剔除指令剔除所述目标文本集中的所述目标文本停用词,得到剔除结果;对所述剔除结果进行关键词提取,并根据提取结果组建所述方面词集。4.根据权利要求3所述的主语义分析方法,其特征在于,所述对所述剔除结果进行关键词提取,并根据提取结果组建所述方面词集之后,还包括:提取所述方面词集中的目标方面词;将所述目标方面词在所述预设文本中遍历,得到目标遍历结果;判断所述目标遍历结果是否满足预设结果;若所述目标遍历结果满足所述预设结果,获得第一添加指令;根据所述第一添加指令,将所述目标方面词添加至所述预设方面词集。5.根据权利要求4所述的主语义分析方法,其特征在于,所述判断所述目标遍历结果是否满足预设结果,还包括:若所述目标遍历结果不满足所述预设结果,获得第二添加指令;根据所述第二添加指令,将所述目标方面词添加至非预设方面词集。6.根据权利要求1所述的主语义分析方法,其特征在于,所述对所述预设方面词集进行聚类分析得到预设方面词类别集,包括:提取所述预设方面词集中的目标预设方面词;对所述目标预设方面词进行分析,并根据分析结果得到目标预设方面词类别;根据所述目标预设方面词类别对所述预设方面词集进行聚类分析,得到所述预设方面2CN115841120A权利要求书2/2页词类别集。7.根据权利要求2所述的主语义分析方法,其特征在于,包括:根据所述总体字数获得预设次数阈值;判断所述出现总次数是否满足所述预设次数阈值,获得判断结果;根据所述判断结果,对所述预设方面词类别集进行调整。8.一种基于方面词的主语义分析系统,其特征在于,包括:确定模块:所述确定模块用于获得预设文本的基本特征信息,并根据所述基本特征信息确定目标主题;组成模块:所述组成模块用于采集所述目标主题的文本信息,并组成目标文本集;构建模块:所述构建模块用于对所述目标文本集进行分析,并根据分析结果构建所述目标主