预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号(10)申请公布号CNCN103812826103812826A(43)申请公布日2014.05.21(21)申请号201210442421.0(22)申请日2012.11.08(71)申请人中国电信股份有限公司地址100033北京市西城区金融大街31号(72)发明人于洪涌郭涛张京晖(74)专利代理机构中国国际贸易促进委员会专利商标事务所11038代理人孙宝海(51)Int.Cl.H04L29/06(2006.01)H04L12/58(2006.01)权权利要求书3页利要求书3页说明书10页说明书10页附图6页附图6页(54)发明名称垃圾邮件识别方法和识别系统、以及过滤系统(57)摘要本发明公开了一种基于用户通信行为的垃圾邮件识别方法和识别系统、以及过滤系统,涉及反垃圾邮件技术领域。其中方法包括提取接收的电子邮件的发件人和收件人的电子邮件地址;根据发件人和收件人的电子邮件地址,在用户通信系数库中查找是否存在该发件人相对于该收件人的用户通信系数,用户通信系数基于用户通信行为构建,表示该收件人与该发件人的联系程度;如果存在对应的用户通信系数,根据用户通信系数确定电子邮件对该收件人来说是否为垃圾邮件。这种基于用户通信行为的垃圾邮件识别方案不宜被规避,并且充分考虑用户个性化的通信关系,提高了垃圾邮件识别和过滤的准确性。CN103812826ACN103826ACN103812826A权利要求书1/3页1.一种垃圾邮件识别方法,包括:提取接收的电子邮件的发件人和收件人的电子邮件地址;根据发件人和收件人的电子邮件地址,在用户通信系数库中查找是否存在该发件人相对于该收件人的用户通信系数,用户通信系数基于用户通信行为构建,表示该收件人与该发件人的联系程度;如果存在对应的用户通信系数,根据所述用户通信系数确定所述电子邮件对该收件人来说是否为垃圾邮件。2.根据权利要求1所述的方法,其特征在于,在接收所述电子邮件之前,还包括基于用户通信行为信息建立用户通信行为向量库和用户通信系数库的操作,具体包括:采集用户通信行为信息;根据采集的用户通信行为信息形成用户通信行为向量,并将用户通信行为向量保存到用户通信行为向量库中;根据用户通信行为向量形成用户通信系数,并将用户通信系数保存到用户通信系数库中。3.根据权利要求2所述的方法,其特征在于,所述采集用户通信行为信息的操作具体包括:接收用户通过终端上传的用户通信行为信息,所述用户通信行为信息包括联系人邮箱和电话号码的对应关系、黑白名单数据、语音通信数据、短信通信数据和电子邮件通信数据,所述黑白名单数据包括用户通讯录黑白名单,所述语音通信数据包括拒接电话、电话通话频率和主动拨出电话频率,所述短信通信数据包括短信通信频率、主动发送短信频率、设为垃圾短信的电话号码,所述电子邮件通信数据包括邮件收发频率、主动发送邮件频率、设为垃圾邮件的电子邮件地址。4.根据权利要求2所述的方法,其特征在于,所述根据采集的用户通信行为信息形成用户通信行为向量的操作具体包括:从用户通信行为信息中提取用户的电子邮箱地址和电话号码,形成以该电子邮箱地址为主索引的用户通信行为向量,并将该用户的电话号码添加到该用户通信行为向量中;从用户通信行为信息中提取该用户的联系人的电子邮箱地址,形成以联系人的电子邮箱地址为副索引的用户通信行为向量的子向量;根据用户通信行为信息形成子向量的分量。5.根据权利要求4所述的方法,其特征在于,所述根据用户通信行为信息形成子向量的分量的操作具体包括:根据采集的用户通信行为信息中的黑白名单数据,生成黑白名单分量,以表示联系人是该用户的黑名单用户或白名单用户;根据采集的用户通信行为信息中的语音通信数据,生成语音分量,以表示用户与联系人之间的通话频率和用户对联系人来电的响应积极程度;根据采集的用户通信行为信息中的短信通信数据,生成短信分量,以表示用户与联系人之间的短信联系频率和用户对联系人的短信的响应积极程度;根据采集的用户通信行为信息中的电子邮件通信数据,生成电子邮件分量,以表示用户与联系人之间的邮件联系频率和用户对联系人的邮件的响应积极程度。2CN103812826A权利要求书2/3页6.根据权利要求2所述的方法,其特征在于,所述根据用户通信行为向量形成用户通信系数的操作具体为:将用户通信行为向量中用户与联系人子分量所属的各分量按照各自的权值进行加权求和运算;根据运算结果确定用户通信系数,以表示用户与该联系人的联系程度。7.根据权利要求1所述的方法,其特征在于,所述根据所述用户通信系数确定所述电子邮件对该收件人来说是否为垃圾邮件还包括:根据所述电子邮件的关键字或邮件结构与预先设置的垃圾邮件的邮件特征进行匹配得到匹配结果;根据所述用户通信系数和所述