预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115033806A(43)申请公布日2022.09.09(21)申请号202210731090.6(22)申请日2022.06.24(71)申请人东软睿驰汽车技术(大连)有限公司地址116000辽宁省大连市经济技术开发区九号办公区发展大厦515(72)发明人王雪曹斌(74)专利代理机构北京超成律师事务所11646专利代理师王晓菲(51)Int.Cl.G06F16/9536(2019.01)G06F40/253(2020.01)G06F40/30(2020.01)G06K9/62(2022.01)权利要求书2页说明书14页附图3页(54)发明名称基于网络评论的用户性别确定方法、装置和电子设备(57)摘要本发明提供了一种本发明提供的一种基于网络评论的用户性别确定方法、装置和电子设备,涉及人工智能技术领域。通过获取网络评论语料,并对所述网络评论语料进行预处理,得到预处理后的网络评论语料;根据语法特征模型,确定预处理后的网络评论语料对应的目标语法特征,所述目标语法特征用于确定网络评论语料的用户性别的语言特征,所述目标语法特征包括以下的一种或多种:词类、词组和句式;根据所述目标语法特征属于每种用户性别的评价值,确定每个所述目标语法特征的熵权值;根据网络评论语料对应的目标语法特征属于每种用户性别的熵权值,确定用户性别。以此通过语法特征以及熵权值,可以有效的判断评论的性别,提升了性别识别的准确性。CN115033806ACN115033806A权利要求书1/2页1.一种基于网络评论的用户性别确定方法,其特征在于,所述方法包括:获取网络评论语料,并对所述网络评论语料进行预处理,得到预处理后的网络评论语料;根据语法特征模型,确定所述预处理后的网络评论语料对应的目标语法特征,所述目标语法特征为用于确定网络评论语料的用户性别的语言特征,所述目标语法特征包括以下的一种或多种:词类、词组和句式;根据所述目标语法特征属于每种用户性别的评价值,确定每个所述目标语法特征的熵权值;根据所述网络评论语料对应的目标语法特征属于每种用户性别的熵权值,确定用户性别。2.根据权利要求1所述的方法,其特征在于,根据语法特征模型,确定所述预处理后的网络评论语料对应的目标语法特征的步骤,包括:获取所述预处理后的网络评论语料中的语法特征;根据所述语法特征模型对应的语法特征范围,确定所述语法特征中的目标语法特征,所述语法特征范围中的每个语法特征的卡方值符合预设要求。3.根据权利要求1所述的方法,其特征在于,根据所述目标语法特征属于每种用户性别的评价值,确定每个所述目标语法特征的熵权值的步骤,包括:根据每个所述目标语法特征对应的指标种类,确定每个所述目标语法特征对于每种用户性别的评价值,其中,每个所述目标语法特征包括至少一种指标;基于所述评价值计算每种用户性别中每个所述目标语法特征对应的指标的比重;根据每种指标的比重,计算所述指标的熵权值。4.根据权利要求1所述的方法,其特征在于,根据所述网络评论语料对应的目标语法特征属于每种用户性别的熵权值,确定用户性别的步骤,包括:获取所述网络评论语料对应的目标语法特征中,属于男性性别的熵权值和属于女性性别的熵权值;将属于男性性别的每个目标语法特征对应的熵权值和属于女性性别的每个目标语法特征对应的熵权值,分别进行加和;根据男性性别熵权值和女性性别熵权值,确定每个用户性别。5.根据权利要求4所述的方法,其特征在于,根据男性性别熵权值和女性性别熵权值,确定每个用户性别的步骤,包括:若所述男性性别熵权值大于所述女性性别熵权值,则所述网络评论语料的用户性别为男性;若所述男性性别熵权值小于所述女性性别熵权值,则所述网络评论语料的用户性别为女性。6.根据权利要求1所述的方法,其特征在于,所述语法特征模型通过网络评论样本训练得到。7.根据权利要求1所述的方法,其特征在于,获取网络评论语料,并对所述网络评论语料进行预处理,得到预处理后的网络评论语料的步骤,包括:获取用户评论的网络页面,从所述网络页面中抽取网络评论语料;2CN115033806A权利要求书2/2页对所述网络评论语料进行分词操作。8.一种基于网络评论的用户性别确定装置,其特征在于,所述装置包括:语料获取模块,获取网络评论语料,并对所述网络评论语料进行预处理,得到预处理后的网络评论语料;特征确定模块,根据语法特征模型,确定所述预处理后的网络评论语料对应的目标语法特征,所述目标语法特征为用于确定网络评论语料的用户性别的语言特征,所述目标语法特征包括以下的一种或多种:词类、词组和句式;权值确定模块,根据所述目标语法特征属于每种用户性别的评价值,确定每个所述目标语法特征的熵权值;性别确定模块,根据所述网络评论语料对应的目标语法特征属于每种用