预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于大数据的供应商信用评估方法许浩宇摘要:在现今的企业生产经营中,为了更好的降低自身的生产采购成本,就需要建立起合理、规范的供应商管理制度,所以对供应商开展信用评估起到了一定的意义。本文基于大数据环境背景下,建立起供应商信用评估使用方法,先确定出信用评估相关指标,并论述指标构建使用的方法,再使用及机器学习算法建立起信用评价模式,最后根据对供应商评价的结果给出相应的处理措施。关键词:大数据;供应商;信用评估方法对于企业自身的发展来讲,与供应商之间建立起长期、稳定的关系,对于企业生产产品的质量、成本等多方面起到影响。为了有效的解决该问题的存在,需要根据企业自身的实际情况制定出合理的供应商管理制度,现今供应商质量存在着良莠不齐的现象,需要企业定期的对供应商开展评价与考核,以此确保供应商的等级,并根据供应商的等级具有针对性的筛选,以此提升产品供货质量。一、评估指标的选取在现今物联网与大数据发展的环境下,对于企业的信用评估需要考虑所有的综合因素,并结合使用现今往网下认证与网上评估,才能构建起企业信用评估体系。我们可以将企业信用评估体系划分为静态体系与动态体系,静态指标主要指的是企业的实体信息,其中包含了注册信息、注册年限以及信用等级等多个方面。动态指标通常情况下是用在实际交易或者是线下交易过程中,从卖方的角度来看,动态指标主要集中在以下方面,产品情况中指的是产品质量、支付价格等,支付方便度、运输质量、沟通态度以及交易次数等。二、指标构建方法本文的论述中主要基于数据考虑的基础之上,使用线性与非线性等方法,最终给出了相关的指标构建方法。首先,数据获取,在现今互聯网大数据的时代发展背景下,能够用来使用的数据量是非常多的,并且可以在网络上自由的获取信息,通过使用网络爬虫程序,可以更好、更轻松的获取到获取到目标程序。但是网络上获取到的数据呈现出明显的多样化、非结构性特征,且获取到的数据有着噪声大、缺失值多等诶单,这也就导致对数据开展的处理工作变得非常复杂。为了能够解决实际存在的问题,就要基于广度优先遍历的策略基础之上,促进工作的程序结构化与模块化的实现。在已有明确的评估指标情况之下,可以保障多所有数据获取过程的自动化,尽可能的减少工作开展中出现的人工干预情况,以此来保障所有数据的一致性。如上述步骤中所提到的,可以将爬虫算法划分为如下的几个阶段:对供应商的选择——根据算法的使用可以将供应商的主页网址与相关信息的网页作为程序的入口,并且进行入栈;对核心网页的解析——通过解析算法的使用可以爬取到相应的网页,以此保障所获取到的网页链接信息的有效性,并且对其中抽取的网页信息数据进行验证;对数据的清洗——在数据使用过程中,针对于缺失的数据值进行填充时,需要删除掉一些不必要的数据,以此保障对数据化结构的调整;数据集成——主要从结构化的数据中获取并计算出相应的评估指标方法;数据存储——将相应的指标数据有效的存储到相应的数据库中。其次,数据标准化处理。在创建出具体的指标数据之前,需要对一些原始的数据标准化展开处理,以此保障相关数据之间的构成可以形成同趋化。本文主要使用的是z-score标准化方法实现了对数据的处理,主要使用的公式如下:在本公式中n代表的是样本个数,x1则表示的是样本属性取值,x指的是样本中的属性均值,xstd则表示的是样本属性的标准差。三、信用评价模型对于信用的评估通常情况下采用的是评分卡的方式,但是在该方式的使用过程中有着非常多的人工影响因素,对于结果的判定往往需要结合专家的经验。随着近些年我国机器学习技术的不断发展,促使机器建模方法的应用,强化了评估方法的开展。在对该方法使用的过程中,所有的评价结果都是依赖数据资料,不会受到分析人员的影响。综上所述,在本文中使用的是Boosting算法实现对用户信用等级分类的计算。(1)Xgboost算法对于及其学习方法来讲,Boosting算法的使用,实现了弱分类转化为强分类的方法,可以有效的达到分类的目的。Boosting算法在使用过程中最具代表性的就是GBDT,但是使用Xgboost算法,实现了对GBDT算法的改进以及提升,最大效率的提升在环境发展下算法的执行效率,可以将其描述为在本公式中i=1,2……n表示的都是特征数据;其中F表示的是弱分类器的集合,可以使用fK进行表示。(2)评价标准在现今大数据发展背景之下,针对于企业信用评价体系的特征,可以使用Xgboost模型,实现对每个企业用户征信等级的分析,同时建立起有效的信用评估等级,并且使用优、良、中、差进行分析表示。四、供应商评价结果与相关措施优所代表的是优秀的供货商,也就是企业在长期发展中可以优先考虑的供货商,将其列为长期供货商;良与中级可以将其视为正常的供应商,根据供应商实际的考核结果,以及其自身的意愿,可以将其划分为“优”等的供应商。针对于差级的