预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107155010A(43)申请公布日2017.09.12(21)申请号201610119034.1(22)申请日2016.03.02(71)申请人北京京东尚科信息技术有限公司地址100080北京市海淀区杏石口路65号西杉创意园西区11C楼东段1-4层西段1-4层申请人北京京东世纪贸易有限公司(72)发明人赵志雄(74)专利代理机构北京成创同维知识产权代理有限公司11449代理人蔡纯张靖琳(51)Int.Cl.H04M3/523(2006.01)H04L12/24(2006.01)权利要求书3页说明书10页附图5页(54)发明名称基于大数据处理用户语音呼叫的方法、装置和系统(57)摘要本发明公开了一种基于大数据的数据处理及语音呼叫分流方法和系统,所述数据处理方法包括:根据用户信息采集用户历史行为数据;根据采集到的历史行为数据,对用户指标进行分布式汇总计算和分析,得到多个场景的多个描述数据;和根据所述多个场景的多个描述数据,并依据相应的算法得到用于处理用户语音呼叫的预测模块。所述分流方法包括:根据用户的语音呼叫信息,获得用户电话号码信息;根据所述用户电话号码信息获得匹配的用户帐号信息;根据所述用户帐号信息预测用户问题类型;根据所述用户问题类型将语音呼叫转入相应的坐席,或由IVR系统将语音呼叫转入相应的坐席。本发明减少了用户在IVR系统的停留时间,提高了沟通效率,减少了运作成本。CN107155010ACN107155010A权利要求书1/3页1.一种基于大数据处理用户语音呼叫的数据处理方法,其中,包括:根据用户信息采集用户历史行为数据;根据采集到的用户历史行为数据,对用户指标进行分布式汇总计算和分析,得到多个场景的多个描述数据;其中,所述用户指标为用户具体行为的数据化描述;和根据所述多个场景的多个描述数据,并依据相应的算法得到用于基于用户语音呼叫预测用户问题类型的预测模块。2.如权利要求1所述的基于大数据处理用户语音呼叫的数据处理方法,其中,依据相应的算法得到用于处理语音呼叫的预测模块包括以下步骤:依据多个场景的多个描述数据,通过对描述数据中的基础指标进行运算得到针对每一场景的至少一条规则;将所述规则转换为与预设算法对应的算法特征,并将每一条规则的预测结果作为特征值,其中,所述预设算法至少为一种;选取预设算法中的一种算法及与其相对应的算法特征及特征值,应用训练样本得到预测模块;根据预定验证规则验证所述预测模块是否符合验证规则的规定,如果不符合,更换所述算法及与其相对应的算法特征与特征值及训练样本,重新训练得到预测模块,直到得到的预测模块符合验证规则的规定为止。3.如权利要求2所述的基于大数据处理用户语音呼叫的数据处理方法,其中,得到符合验证规则规定的预测模块后,还包括对所述预测模块的优化步骤:选取不同日期的训练数据,按照训练得到多个预测模块;从每一个预测模块中转换得到一个包括多个规则的规则集;从所述多个规则集中抽取出符合相似度要求的规则;将抽取到的规则转换成算法特征;应用算法特征、特征值和训练样本得到稳定预测模块。4.如权利要求3所述的基于大数据处理用户语音呼叫的数据处理方法,其中,在得到稳定预测模块之后还包括:按照预定处理周期,计算与用户最新行为数据相对应的算法特征值。5.如权利要求2所述的基于大数据处理用户语音呼叫的数据处理方法,其中,对描述数据中的基础指标进行运算得到针对每一场景的至少一条规则,具体包括:依据场景的描述数据,从与所述场景对应的多个数据源之一中选取至少一个数据;依据设定的过滤规则,对所述至少一个数据进行过滤;从过滤后的数据中选择符合设定周期的数据;基于符合设定周期的数据,根据预定的判断逻辑形成所述场景的一条规则。6.如权利要求2所述的基于大数据处理用户语音呼叫的数据处理方法,其中,所述基础指标包括:用户最近15天内只下过自营订单或POP订单;购买商品的退换货率;购买商品的取消购买率;最近一周未完成售后服务单类型或最近一周未完成事件类型。7.如权利要求2所述的基于大数据处理用户语音呼叫的数据处理方法,其中,所述预定验证规则包括准确度:2CN107155010A权利要求书2/3页正确预测的用户数与已预测用户数的比值;所述预定验证规则还包括可解释性:业务方对所述预测模块的理解程度,包括不同的级别;或/和所述预定验证规则还包括业务合理性:判断预测的过程与业务逻辑是否相符合,如果符合,则合理,如果不符合,则不合理。8.如权利要求1或2所述的基于大数据处理用户语音呼叫的数据处理方法,其中,所述算法流程包括DecisionTree、LogisticRegression、NaiveBayesian、RandomForests或SVM中的任意一种或多