预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

“拍照赚钱”的任务定价 摘要 小四宋体 关键词:支持向量机主成分分析 1.问题重述 “拍照赚钱”是用户下载APP,注册成为APP的会员,然后从APP上领取需要拍照的任务,赚取APP对任务所标定的酬金的过程。APP成为该平台运行的核心,而APP中的任务定价又是其核心因素。如果定价不合理,有的任务就会无人问津,而导致商品检查的失败。本题给出附件一:已结束项目的任务数据;附件二:会员信息数据:附件三:新项目任务数据(只有任务的位置信息)。 研究附件1中的项目,任务定价规律,分析任务的未完成原因。 为附件1中的项目设计新的任务定价方案,和原方案进行比较。 实际情况时,多个任务可能因为位置较为集中,导致用户会争相选择,一种考虑是将这些任务联合在一起打包发布。在这种考虑下,如何修改前面的定价模型,对最终任务完成的情况有什么影响? 对附件三中的新项目给出自己的任务定价方案,并评价该方案的实施效果。 2.基本假设 1) 2) 3) 4) 5) 3.符号说明 序号符号符号说明1X1维度2X2经度3X3任务标价4X4任务完成情况5Q1原方案成本6Q2新方案成本78910 4.问题(1)的模型建立、求解 4.1问题分析 对于问题一,我们主要研究了附件一中的四项数据(任务gps维度、任务gps经度、任务标价、任务执行情况)。通过初步观察任务的gps经纬度都和任务标价、任务执行情况相关,为了进行详细分析,我们采用了主成分回归分析法。 模型准备 主成分分析的目的主要是用较少的变量转化成彼此相互独立或不相关的变量,通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。由此可见,主成分分析实际上是一种降维方法。 主成分分析的结果受量纲的影响,如果改变量纲,则会由于各变量的单位可能不同而导致结果不一样,而回归分析是不存在这样的情况的,所以可以先把各变量的数据标准化,使用相关系数矩阵进行分析。我们使用主成分回归分析,是为了克服最小二乘(LS)估计在数据矩阵中存在多重共线性时表现出的不稳定性。 我们选择其中一部分重要的主成分作为新的自变量,丢弃了一部分影想不大的自变量,实际上达到了降维的目的,然后用最小二乘法对选取主成分后的模型参数进行估计,最后再变成原来的模型求出参数的估计。 模型建立与求解 4.3.1:数据的初步处理 由于附件一所给数据量纲不同,且数值差过大,我们对该数据进行了统一处理,处理如下(下表只显示部分处理数据,详细请看支撑材料): 表1附件一部分数据 任务号码任务gps纬度任务gps经度任务标价任务执行情况A000122.56614113.9808660A000222.68621113.940565.50A000322.57651113.957265.51A000422.56484114.2446750A000522.55889113.950765.50A000622.559114.2413750使用Excel求得任务经纬度和任务标价平均值后,分别除以所有该项目数据,得到如下(部分)结果: 表二附件一处理后数据 任务号码任务gps纬度任务gps经度任务标价任务执行情况A00010.9818819961.0039047610.9549896040A00020.9871060931.003549710.9477548340A00030.982333191.0036965580.9477548341A00040.9818253691.0062276441.0852154590A00050.9815663431.0036395260.9477548340A00060.9815711871.0061989861.0852154590平均值22.98254238119.537538569.110778 4.3.2主成分分析回归模型 4.3.2.1完成情况(X4)分析 首先我们利用Matlab软件求出任务gps维度X1,任务gps经度X2,任务标价X3的相关系数矩阵r和矩阵的特征值那么大,特征向量n,特征值贡献率 表3X1,X2,X3相关系数矩阵 X1X2X3X11.0000-0.52060.0855X2-0.52061.0000-0.0597X30.0855-0.05971.0000相关系数矩阵的三个特征值依次为nameda1.5401 0.9811 0.4787 特征向量[0.6969,-0.6924,0.1868] [-0.1069,0.1573,0.9817] [0.7091,0.7042,-0.0357] 各个特征值的贡献率51.3376 32.7044 15.9581 前两个特征值的和所占比例(累积贡献率)达到:51.3376+32.7044,由此略去第三个成分。