预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

根据数据类型的不同,对一个问题的建模有不同的方式。在机器学习或者人工智 能领域,人们首先会考虑算法的学习方式。在机器学习领域,有几种主要的学习 方式。将算法按照学习方式分类是一个不错的想法,这样可以让人们在建模和算 法选择的时候考虑能根据输入数据来选择最合适的算法来获得最好的结果。 监督式学习: 在监督式学习下,输入数据被称为“训练数据”,每组训练数据有一个明确的标 识或结果,如对防垃圾邮件系统中“垃圾邮件”“非垃圾邮件”,对手写数字 识别中的“1“,”2“,”3“,”4“等。在建立预测模型的时候,监督式学习 建立一个学习过程,将预测结果与“训练数据”的实际结果进行比较,不断的 调整预测模型,直到模型的预测结果达到一个预期的准确率。监督式学习的常见 应用场景如分类问题和回归问题。常见算法有逻辑回归(LogisticRegression) 和反向传递神经网络(BackPropagationNeuralNetwork) 非监督式学习: 在非监督式学习中,数据并不被特别标识,学习模型是为了推断出数据的一些内 在结构。常见的应用场景包括关联规则的学习以及聚类等。常见算法包括 Apriori算法以及k-Means算法。 半监督式学习: 在此学习方式下,输入数据部分被标识,部分没有被标识,这种学习模型可以用 来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进 行预测。应用场景包括分类和回归,算法包括一些对常用监督式学习算法的延伸, 这些算法首先试图对未标识数据进行建模,在此基础上再对标识的数据进行预测。 如图论推理算法(GraphInference)或者拉普拉斯支持向量机(LaplacianSVM.) 等。 强化学习: 在这种学习模式下,输入数据作为对模型的反馈,不像监督模型那样,输入数据 仅仅是作为一个检查模型对错的方式,在强化学习下,输入数据直接反馈到模型, 模型必须对此立刻作出调整。常见的应用场景包括动态系统以及机器人控制等。 常见算法包括Q-Learning以及时间差学习(Temporaldifferencelearning) 在企业数据应用的场景下,人们最常用的可能就是监督式学习和非监督式学习 的模型。在图像识别等领域,由于存在大量的非标识的数据和少量的可标识数 据,目前半监督式学习是一个很热的话题。而强化学习更多的应用在机器人控 制及其他需要进行系统控制的领域。 算法类似性 根据算法的功能和形式的类似性,我们可以把算法分类,比如说基于树的算法, 基于神经网络的算法等等。当然,机器学习的范围非常庞大,有些算法很难明确 归类到某一类。而对于有些分类来说,同一分类的算法可以针对不同类型的问题。 这里,我们尽量把常用的算法按照最容易理解的方式进行分类。 回归算法 回归算法是试图采用对误差的衡量来探索变量之间的关系的一类算法。回归算法 是统计机器学习的利器。在机器学习领域,人们说起回归,有时候是指一类问题, 有时候是指一类算法,这一点常常会使初学者有所困惑。常见的回归算法包括: 最小二乘法(OrdinaryLeastSquare),逻辑回归(LogisticRegression), 逐步式回归(StepwiseRegression),多元自适应回归样条(Multivariate AdaptiveRegressionSplines)以及本地散点平滑估计(LocallyEstimated ScatterplotSmoothing) 基于实例的算法 基于实例的算法常常用来对决策问题建立模型,这样的模型常常先选取一批样本 数据,然后根据某些近似性把新数据与样本数据进行比较。通过这种方式来寻找 最佳的匹配。因此,基于实例的算法常常也被称为“赢家通吃”学习或者“基于 记忆的学习”。常见的算法包括k-NearestNeighbor(KNN),学习矢量量化 (LearningVectorQuantization,LVQ),以及自组织映射算法 (Self-OrganizingMap,SOM) 正则化方法 正则化方法是其他算法(通常是回归算法)的延伸,根据算法的复杂度对算法进 行调整。正则化方法通常对简单模型予以奖励而对复杂算法予以惩罚。常见的算 法包括:RidgeRegression,LeastAbsoluteShrinkageandSelectionOperator (LASSO),以及弹性网络(ElasticNet)。 决策树学习 决策树算法根据数据的属性采用树状结构建立决策模型,决策树模型常常用来 解决分类和回归问题。常见的算法包括:分类及回归树(ClassificationAnd RegressionTree,CART),ID3(Iterativ