预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115239288A(43)申请公布日2022.10.25(21)申请号202210841250.2(22)申请日2022.07.18(71)申请人珠海格力电器股份有限公司地址519070广东省珠海市前山金鸡西路申请人珠海联云科技有限公司(72)发明人徐鑫白金蓬聂嘉良(74)专利代理机构北京华夏泰和知识产权代理有限公司11662专利代理师杜欣(51)Int.Cl.G06Q10/10(2012.01)G06K9/62(2022.01)G06N20/00(2019.01)H04L51/42(2022.01)权利要求书2页说明书9页附图2页(54)发明名称一种邮件类别的识别方法、装置、电子设备和存储介质(57)摘要本申请提供了一种邮件类别的识别方法、装置、电子设备和存储介质,所述方法包括:获取设定邮箱对应的样本邮件的邮件特征,其中,所述样本邮件为以所述设定邮箱为收件地址但还未发送至所述设定邮箱中的待分类的邮件;根据所述邮件特征,通过非监督聚类算法将所述样本邮件划分为不同的邮件类别;根据预设方案识别出不同的邮件类别。本申请提高邮件类别识别的准确性。CN115239288ACN115239288A权利要求书1/2页1.一种邮件类别的识别方法,其特征在于,所述方法包括:获取设定邮箱对应的样本邮件的邮件特征,其中,所述样本邮件为以所述设定邮箱为收件地址但还未发送至收件箱中的待分类的邮件;根据所述邮件特征,通过非监督聚类算法将所述样本邮件划分为不同的邮件类别;根据预设方案识别出不同的邮件类别。2.根据权利要求1所述的方法,其特征在于,所述根据所述邮件特征,通过非监督聚类算法将所述样本邮件划分为不同的邮件类别包括:从所述样本邮件中随机选取n个初始质心,其中,每个所述初始质心指示一个类别的邮件,n≥2;通过K‑means算法,根据样本邮件的邮件特征,将所述样本邮件分别划分至距离最近的初始质心所在的类簇中;根据每个类簇中的样本邮件重新确定质心,直至重新确定的质心与所述初始质心之间的距离小于终止阈值,则将所述样本邮件划分为不同邮件类别。3.根据权利要求2所述的方法,其特征在于,所述通过K‑means算法,根据样本邮件的邮件特征,将所述样本邮件分别划分至距离最近的初始质心所在的类簇中包括:通过对所述样本邮件的邮件特征的分析,确定所述样本邮件的样本向量和所述初始质心的质心向量;计算所述样本向量与每个质心向量之间的向量距离;将所述样本邮件分别划分至最小的向量距离对应的初始质心所在的类簇中。4.根据权利要求1所述的方法,其特征在于,根据预设方案识别出不同的邮件类别之后,所述方法还包括:设置邮件控制信息,其中,所述邮件控制信息用于指示拦截预设邮件类的邮件和将非预设邮件类的邮件发送至所述设定邮箱的收件箱。5.根据权利要求4所述的方法,其特征在于,设置邮件控制信息之后,所述方法还包括:获取目标邮件的邮件特征,其中,所述目标邮件为设置邮件控制信息后用户新收到的未分类邮件;根据所述邮件特征,通过非监督聚类算法将所述目标邮件划分至对应的邮件类别;在所述邮件类别为预设邮件类的情况下,根据所述邮件控制信息拦截所述目标邮件;在所述邮件类别为非预设邮件类的情况下,根据所述邮件控制信息将所述目标邮件发送至所述设定邮箱的收件箱。6.根据权利要求1所述的方法,其特征在于,所述邮件类别包括垃圾邮件类和非垃圾邮件类,所述根据预设方案识别出不同的邮件类别包括:识别目标类别中的邮件特征,其中,所述目标类别为垃圾邮件类和非垃圾邮件类中的任一种类别;针对所述目标类别的样本邮件,确定符合垃圾邮件特征的垃圾邮件所占的垃圾邮件比例;在所述垃圾邮件比例超过预设比例的情况下,确定所述目标类别为垃圾邮件类;将除所述目标类别外的另一个类别设为非垃圾邮件类。7.根据权利要求1所述的方法,其特征在于,所述邮件类别包括垃圾邮件类和非垃圾邮2CN115239288A权利要求书2/2页件类,所述根据预设方案识别出不同的邮件类别包括:分别确定每个邮件类别中的邮件数量;将邮件数量最少的邮件类别设置为垃圾邮件类,并将邮件数量最多的邮件类别设置为非垃圾邮件类。8.一种邮件类别的识别装置,其特征在于,所述装置包括:获取模块,用于获取设定邮箱对应的样本邮件的邮件特征,其中,所述样本邮件为以所述设定邮箱为收件地址但还未发送至所述设定邮箱中的待分类的邮件;划分模块,用于根据所述邮件特征,通过非监督聚类算法将所述样本邮件划分为不同的邮件类别;识别模块,用于根据预设方案识别出不同的邮件类别。9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放